确定语句/文本的正面或负面程度的算法

标签 algorithm nlp

我需要一种算法来确定句子、段落或文章的语气是消极的还是积极的……或者更好的是,确定消极或积极的程度。

例如:

Jason is the worst SO user I have ever witnessed (-10)

Jason is an SO user (0)

Jason is the best SO user I have ever seen (+10)

Jason is the best at sucking with SO (-10)

While, okay at SO, Jason is the worst at doing bad (+10)

不容易吧? :)

我不希望有人向我解释这个算法,但我认为学术界的某个地方已经有很多类似的工作。如果您能给我指出一些文章或研究,我会很乐意的。

谢谢。

最佳答案

自然语言处理有一个子领域叫做sentiment analysis专门处理这个问题域。由于消费者产品在在线用户论坛(ugc 或用户生成的内容)中受到大量评论,因此该领域开展了大量商业工作。还有一个用于文本分析的原型(prototype)平台,称为 GATE来自谢菲尔德大学,以及一个名为 nltk 的 python 项目.两者都被认为是灵活的,但性能不是很高。一个或另一个可能有助于制定您自己的想法。

关于确定语句/文本的正面或负面程度的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/293000/

相关文章:

python - 关于 KERAS 中用于主题建模的文本自动编码器

python - 使用 torchnlp 进行文本分类

algorithm - 为添加/删除设置平均 O(1) 和最差的最大/最小 O(log n)

c# - 消除删除空目录算法中的递归

algorithm - Dijkstra:在有向图中找到最短路径

apache - 如何使用 Apache Lucene 5.3.1 仅索引最小长度的单词?

machine-learning - 这个 NLP 符号的含义是什么?

python - 在python中,如何计算特定日期超过 "base date"有多少天?

performance - 如何比较两个数据结构的运行时间

algorithm - 在 Scala 中实现成对线性距离