我想从文本中提取重要术语并创建特定于领域的术语集。然后我想了解这些词在文本中是如何使用的,无论是积极的还是消极的。
你知道有什么开源项目可以帮助我完成这项任务吗?
编辑:
示例文本:
"Although car is not comfortable, I like the design of it."
从这段文字中,我想提取如下内容:
design: positive
comfort(able): negative
最佳答案
为了解析文本并获取所需的词性,有很多工具包
http://incubator.apache.org/opennlp/
等等
查看http://en.wikipedia.org/wiki/Sentiment_analysis寻找关于如何积极或消极地使用词语的想法,如果你的意思是内涵的话。我不知道有什么可靠的平台可以做到这一点,但也许你可以告诉我们更多关于你的问题的一些想法。
如果没有可以为您完成此操作的工具包,您可能会发现将 NP 和 ADJ 链接到它们就足够了。您还需要否定检测。我使用过这个 ohnlp.sourceforge.net (基于 Apache UIMA 构建),它带有一个相当不错的否定检测算法。
关于open-source - 术语提取和情感分析开源项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5555170/