r - tm 包中的 findAssocs 出现问题

标签 r text-mining

我正在尝试使用 tm 包查找与术语文档矩阵中的特定单词相关的单词。

我正在使用 findAssocs 来执行此操作。 findAssocs 的参数是:

x:术语-文档矩阵。
term:持有术语的角色。
corlimit:相关下限的数字。

我一直得到numeric(0)作为我的结果

示例:

findAssocs(test.dtm, "investment", 0.90)
>numeric(0)

有人熟悉 findAssocs 并知道我做错了什么吗？或者有人更广泛地知道 numeric(0) 结果可能意味着什么？

提前非常感谢您的帮助。

最佳答案

此结果表明，0.90 份文档中没有与“投资”一词相关的单词。尝试使用较低的阈值(例如 0.05)，然后逐步提高到产生较少项的阈值。

关于r - tm 包中的 findAssocs 出现问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12629993/

上一篇：prolog - 数据记录分层

下一篇：ios - SwiftUI 代码在 iPhone 上工作，但在 iPad 上黑屏？

相关文章：

python - 替换字符串中的货币值时，Python 中的 re.sub() 并不总是有效

r 表达重新编码因子

r - 有没有办法在 R 中找到具有实际值(即非 N/A)的向量中最后一个元素的索引

r - 如何在 R 的 igraph 中排列网络？

python - 多线程数据工作的推荐语言

python - 从字符串列表中获取拆分句子的索引

java - 从数据库输入数据并进行处理

r - 如何用正确单词列表替换拼写错误单词列表？

r - Shiny 应用程序中reactable和Leaflet之间的交互(串扰，leafletproxy)

r - 寻找一种优化的方式来替换长文档中的列表模式

©2024 IT工具网联系我们