nlp - 斯坦福 CorenNLP 短语 POS 标签和词形还原解释

我在短语词形还原过程中得到了这个结果:

Gathered requirements

使用corenlp online tool ，该短语的词性标记和词形还原导致:

出于某种原因，“Gathered”被赋予了“JJ”(“形容词”)的词性标签，这可能会导致引理被“gathered”而不是“gather”。

如果输入短语是gathered requests(即小写)，则词性标记被正确识别为动词，并且词形还原结果就是我所期望的:

为什么 CoreNLP 将 Gathered 识别为形容词而不是动词？

最佳答案

当您写下“已收集的需求”时，系统会检查“已收集”一词出现次数最多的 POS 标签的概率。只有某些类型的单词(例如命名实体、句子开头等)以大写字母开头。当你以大写字母开头时，“Gathered”更可能是 JJ 的一般原因是它主要用作形容词而不是句子开头的动词。

关于nlp - 斯坦福 CorenNLP 短语 POS 标签和词形还原解释，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41597099/

相关文章：

c# - 在多个问题中引用 Corefs