我需要一种算法来确定句子、段落或文章的语气是消极的还是积极的……或者更好的是,确定消极或积极的程度。
例如:
Jason is the worst SO user I have ever witnessed (-10)
Jason is an SO user (0)
Jason is the best SO user I have ever seen (+10)
Jason is the best at sucking with SO (-10)
While, okay at SO, Jason is the worst at doing bad (+10)
不容易吧? :)
我不希望有人向我解释这个算法,但我认为学术界的某个地方已经有很多类似的工作。如果您能给我指出一些文章或研究,我会很乐意的。
谢谢。
最佳答案
自然语言处理有一个子领域叫做sentiment analysis专门处理这个问题域。由于消费者产品在在线用户论坛(ugc 或用户生成的内容)中受到大量评论,因此该领域开展了大量商业工作。还有一个用于文本分析的原型(prototype)平台,称为 GATE来自谢菲尔德大学,以及一个名为 nltk 的 python 项目.两者都被认为是灵活的,但性能不是很高。一个或另一个可能有助于制定您自己的想法。
关于确定语句/文本的正面或负面程度的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/293000/