r - tm 包中的 findAssocs 出现问题

标签 r text-mining

我正在尝试使用 tm 包查找与术语文档矩阵中的特定单词相关的单词。

我正在使用 findAssocs 来执行此操作。 findAssocs 的参数是:

  • x:术语-文档矩阵。
  • term:持有术语的角色。
  • corlimit:相关下限的数字。

我一直得到numeric(0)作为我的结果

示例:

findAssocs(test.dtm, "investment", 0.90)
>numeric(0)

有人熟悉 findAssocs 并知道我做错了什么吗?或者有人更广泛地知道 numeric(0) 结果可能意味着什么?

提前非常感谢您的帮助。

最佳答案

此结果表明,0.90 份文档中没有与“投资”一词相关的单词。尝试使用较低的阈值(例如 0.05),然后逐步提高到产生较少项的阈值。

关于r - tm 包中的 findAssocs 出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12629993/

相关文章:

python - 替换字符串中的货币值时,Python 中的 re.sub() 并不总是有效

r 表达重新编码因子

r - 有没有办法在 R 中找到具有实际值(即非 N/A)的向量中最后一个元素的索引

r - 如何在 R 的 igraph 中排列网络?

python - 多线程数据工作的推荐语言

python - 从字符串列表中获取拆分句子的索引

java - 从数据库输入数据并进行处理

r - 如何用正确单词列表替换拼写错误单词列表?

r - Shiny 应用程序中reactable和Leaflet之间的交互(串扰,leafletproxy)

r - 寻找一种优化的方式来替换长文档中的列表模式