python - Vader SentimentIntensityAnalyzer 是多语言的吗?

标签 python machine-learning sentiment-analysis vader

我陷入了情绪分析,我找到了迄今为​​止我能找到的最好的 Vader 解决方案。我的问题是我没有找到任何关于如何用英语以外的语言提供它的文档。

最佳答案

简短的回答是“不”。

github 页面上的 README 文件说明

if you have access to the Internet, the demo has an example of how VADER can work with analyzing sentiment of texts in other languages (non-English text sentences).

但如果您看一下此演示的实际执行情况(从 current version of vaderSentiment.py 中的第 552 行开始),这完全基于使用机器翻译网络服务自动将文本翻译成英语。因此,结果不仅取决于情绪分析工具的准确性,还取决于您用来创建英文版输入的任何翻译工具的准确性。

Vader 仅对英文文本执行情感分析,但该解决方法(自动翻译)可能是一个可行的选择。与其他用法*相比,情感分析对常见机器翻译问题的敏感性较低,但如果您选择使用该变通方法,您肯定仍需牢记这些限制。

*举个例子,演示中使用的服务翻译“Das Internet funktioniert heute nicht. Ist eine Störung bekannt?”到“今天互联网不工作。是否已知一种疾病?”,更准确地翻译为“今天互联网不工作。是否已知中断?”。第一句话的时态错误,虽然在这种情况下有几种“Störung”的合法翻译,但“disorder”充其量是一个尴尬的选择。尽管如此,虽然这使得它的翻译总体上非常糟糕,但这些错误不太可能显着影响情感分析。

关于python - Vader SentimentIntensityAnalyzer 是多语言的吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45275166/

相关文章:

nlp - 从英语单词中消除字母重复的正确方法?

python - 无法找出 -11 的返回码是什么意思

python - 在 Python 中使用 Selenium 从某个 div 获取链接

python - 使用 gdal 将数组转换为 tiff 光栅图像

hadoop - pig 脚本对 10 block 训练数据进行采样,pig 脚本被卡住了

nlp - 用于情绪(情绪)分析的简单工具包(不使用机器学习)

python - Mac 上的 Titanium 桌面构建

java - 如何在j48算法中注入(inject)IBk(knn)? (韦卡、java)

machine-learning - 是否有计算振荡信号重复次数的标准方法?

java - Hadoop HDFS 中 JSON 推文的情感分析