我正在研究基于无监督方面的情感分析。我尝试使用 Vader,这给了我很好的结果,但问题是,如果主题是负面的,比如“食物浪费”,那么情绪总是负面的,即使内容说“我真的很讨厌食物浪费”。 有人可以帮助我解决这个问题,或者甚至建议我一种比维德更好的方法。 我也尝试过使用“Flair”,但其结果并不像 Vader 那样有希望。
最佳答案
在这种情况下,VADER 使用的基于规则的模型可能不是一个好方法,在该短语中,您有 3 个单词肯定会得到负分(讨厌食物浪费),请记住 VADER 针对简洁的社交媒体数据进行了优化并且它无法很好地掌握短语的“上下文”。
我们在 TextBlob 中采用了与 VADER 类似的方法,您无需做太多工作就可以尝试:https://textblob.readthedocs.io/en/dev/
通常,监督路线会给出更好的结果,但您需要良好的预训练模型和良好的数据。
scikit-learn 中的朴素贝叶斯分类器: https://www.datacamp.com/community/tutorials/simplifying-sentiment-analysis-python
随机森林方法,始终使用 scikit-learn: https://stackabuse.com/python-for-nlp-sentiment-analysis-with-scikit-learn/
以下是对各种情感分析方法的回顾: https://towardsdatascience.com/fine-grained-sentiment-analysis-in-python-part-1-2697bb111ed4
关于machine-learning - 基于无监督方面的情感分析中的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59729700/