r - 数音节

标签 r text-mining

我希望为 R 中的文本(例如 Flesh Kincaid)分配一些不同的可读性分数。

有谁知道使用 R 将单词分割成音节的方法?我不一定需要音节段本身,而是需要计数。

所以例如:

x <- c('dog', 'cat', 'pony', 'cracker', 'shoe', 'Popsicle')

会产生:
1, 1, 2, 2, 1, 3

每个数字对应单词中的音节数。

最佳答案

qdap version 1.1.0做这个任务:

library(qdap)
x <- c('dog', 'cat', 'pony', 'cracker', 'shoe', 'Popsicle')
syllable_sum(x)

## [1] 1 1 2 2 1 3

关于r - 数音节,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8553240/

相关文章:

regex - R 正则表达式中的转义句点

r - 在函数内部分配命名空间变量

python - 如何使用 Pandas 中的输入语料库/列表从列中提取所有字符串匹配项?

c# - 文本分类从文本中提取标签

正则表达式正在运行,但代码看起来很糟糕

r - 比较特定时间点的生存

r - 将许多 CSV 合并到不同的数据框中

r - 为什么输出 h2o.kmeans 函数中没有集群对象?

删除文本中数字符比大于平均值的所有句子

python - 在Python中使用短语和词干进行快速词典查找