machine-learning - 基于无监督方面的情感分析中的问题

标签 machine-learning nlp sentiment-analysis unsupervised-learning vader

我正在研究基于无监督方面的情感分析。我尝试使用 Vader,这给了我很好的结果,但问题是,如果主题是负面的,比如“食物浪费”,那么情绪总是负面的,即使内容说“我真的很讨厌食物浪费”。 有人可以帮助我解决这个问题,或者甚至建议我一种比维德更好的方法。 我也尝试过使用“Flair”,但其结果并不像 Vader 那样有希望。

最佳答案

在这种情况下,VADER 使用的基于规则的模型可能不是一个好方法,在该短语中,您有 3 个单词肯定会得到负分(讨厌食物浪费),请记住 VADER 针对简洁的社交媒体数据进行了优化并且它无法很好地掌握短语的“上下文”。

我们在 TextBlob 中采用了与 VADER 类似的方法,您无需做太多工作就可以尝试:https://textblob.readthedocs.io/en/dev/

通常,监督路线会给出更好的结果,但您需要良好的预训练模型和良好的数据。

scikit-learn 中的朴素贝叶斯分类器: https://www.datacamp.com/community/tutorials/simplifying-sentiment-analysis-python

随机森林方法,始终使用 scikit-learn: https://stackabuse.com/python-for-nlp-sentiment-analysis-with-scikit-learn/

以下是对各种情感分析方法的回顾: https://towardsdatascience.com/fine-grained-sentiment-analysis-in-python-part-1-2697bb111ed4

关于machine-learning - 基于无监督方面的情感分析中的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59729700/

相关文章:

python - 如何在 Scikit-Learn 中对训练和测试数据进行分层?

machine-learning - keras.models.Model.fit 中的 "epoch"是什么?

machine-learning - Apple 如何查找电子邮件中的日期、时间和地址?

nlp - 实体情感分析(实体级情感分析)

C++ 情感分析库

machine-learning - 如何参加机器学习编程竞赛

machine-learning - 使用最佳参数构建模型时 GridsearchCV 最佳分数下降

nlp - 从两个句子对齐的文本构建字典?

python - 标签式LDA+引导式LDA主题建模

python - 在 nltk for python 中编辑 Vader_lexicon.txt 以添加与我的域相关的词