r - 如何将列表转换为 r 中的语料库？

标签 r list corpus

在此 question我问如何拆分一个巨大的数据帧来创建一个语料库。多亏了答案，我才能从数据帧创建一个列表。
我的问题还是 从我创建的列表中获取语料库 为了进行一些文本挖掘并根据搜索词对数据进行聚类。

最佳答案

为了解决这个问题，我只是将 tm 包的 as.VCorpus 函数应用到我之前创建的列表中:

new_corpus <- as.VCorpus(new_list)

检查新对象是否为语料库:

class(new_corpus)
[1] "VCorpus" "Corpus"

我因此创建了一个“易变的语料库”。正如 R 文档中所写:

A volatile corpus is fully kept in memory and thus all changes only affect the corresponding R object.

关于r - 如何将列表转换为 r 中的语料库？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34061912/

上一篇：debugging - 在 gdb 中附加进程时如何有选择地读取和加载符号？

下一篇：Hazelcast Jet - 用例

相关文章：

r - 安装 R 包时出现问题

r - 从混合模型 (lme4) 公式中提取成分

list - Prolog 成员/2 谓词

python - 我怎么能在 python/nltk 中使用完整的 penn treebank 数据集

python - 查找文本中的所有位置/城市/地点

r - dplyr 抑制组中某个值的下 n 次出现

r - 将 Jags 模型转换为 stan 模型

css - 仅在 Chrome 中，即使列表样式类型为 :none，也会在 OL 中显示顶部元素的元素符号

python - 从字符串列表中查找最常见的单词

来自CSV文件的R文本挖掘文档(每个文档一行)

©2024 IT工具网联系我们