r - 如何将 LIWC 格式的字典与 R 包 Quanteda 一起使用?

标签 r quanteda

由于 LIWC 软件和词典是专有的,我很高兴看到它们似乎与仍在开发中但优秀的 R 软件包 Quanteda 配合得很好。

R 包 Quanteda 的文档 demonstrates its use with a LIWC-format dictionary ,就像 SO post 一样。

我购买了 LIWC 2015,但不知道如何将字典导出到应用程序之外,只能导出为 PDF。

最佳答案

根据 Receptivity(“LIWC 的商业方面”)的要求进行编辑

我不会建议您如何从包含需要购买的软件的 Java Archive (.jar) 文件中提取英语 LIWC 2015 词典。

与以前版本的 LIWC 软件不同,词典文件不直接随软件分发。但使用您合法购买的序列号登录,您可以从http://dictionaries.liwc.net下载LIWC2007和LIWC2001的非英语词典(取决于语言)。 ,其中包括德语、荷兰语、意大利语、俄语、法语和西类牙语版本。

如果您有一个与 LIWC 词典格式相同的词典,例如 Moral Foundations dictionary ,那么这将起作用:

require(quanteda)
mfdict <- dictionary(file = "http://www.moralfoundations.org/sites/default/files/files/downloads/moral%20foundations%20dictionary.dic", 
                    format = "LIWC")

它将道德基础词典加载并转换为 Quanteda 格式。您可以使用字典来构建文档特征矩阵:

dfm(x, dictionary = mfdict)

关于r - 如何将 LIWC 格式的字典与 R 包 Quanteda 一起使用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33859753/

相关文章:

r - 操作(重命名和重新组合)dfm (quanteda) 中的特征

python - 使用 write.xls() 保存多个数据帧时出错

r - 将矢量图像置于网格中以在 R 中进行克里金法

r - 沿日期刻度线放置网格

r - 根据组内的特定行在 group_by 内进行变异

r - 选择在字典中找到的短语并返回 doc_id 和短语的数据帧

r - 将字符串拆分为数据帧,每个字符一列

r - 如何从 R 中的 Quanteda token 中的文本中删除下划线

R:从 Quanteda DFM、稀疏文档特征矩阵、对象中删除正则表达式?

r - Quanteda:用字典中的引理替换标记的最快方法?