open-source - 术语提取和情感分析开源项目

标签 open-source nlp machine-learning

我想从文本中提取重要术语并创建特定于领域的术语集。然后我想了解这些词在文本中是如何使用的,无论是积极的还是消极的。

你知道有什么开源项目可以帮助我完成这项任务吗?

编辑:

示例文本:

"Although car is not comfortable, I like the design of it."

从这段文字中,我想提取如下内容:

design:        positive
comfort(able): negative

最佳答案

为了解析文本并获取所需的词性,有很多工具包

http://incubator.apache.org/opennlp/

http://www.nltk.org/

等等

查看http://en.wikipedia.org/wiki/Sentiment_analysis寻找关于如何积极或消极地使用词语的想法,如果你的意思是内涵的话。我不知道有什么可靠的平台可以做到这一点,但也许你可以告诉我们更多关于你的问题的一些想法。

如果没有可以为您完成此操作的工具包,您可能会发现将 NP 和 ADJ 链接到它们就足够了。您还需要否定检测。我使用过这个 ohnlp.sourceforge.net (基于 Apache UIMA 构建),它带有一个相当不错的否定检测算法。

关于open-source - 术语提取和情感分析开源项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5555170/

相关文章:

machine-learning - 输入神经元应该有输入权重吗?

.net - 如何选择一个开源项目加入?

c# - WPF (C#) 的优秀开源报告工具/框架

python - 如何使用nltk从字符串中提取名称

python - 有没有办法在Python中操作编号段落来删除某些不按顺序排列的段落?

python - tf.slice 和 tf.strided_slice

python - 如何阻止变量被更新?

python - 在PCA之前对标准化感到困惑

git - 在(上游)开源项目之上维护附加功能

java - 在不同浏览器版本中测试应用程序的工具