我在短语词形还原过程中得到了这个结果:
Gathered requirements
使用corenlp online tool ,该短语的词性标记和词形还原导致:
出于某种原因,“Gathered”被赋予了“JJ”(“形容词”)的词性标签,这可能会导致引理被“gathered”而不是“gather”。
如果输入短语是gathered requests
(即小写),则词性标记被正确识别为动词,并且词形还原结果就是我所期望的:
为什么 CoreNLP 将 Gathered
识别为形容词而不是动词?
最佳答案
当您写下“已收集的需求”时,系统会检查“已收集”一词出现次数最多的 POS 标签的概率。只有某些类型的单词(例如命名实体、句子开头等)以大写字母开头。当你以大写字母开头时,“Gathered”更可能是 JJ 的一般原因是它主要用作形容词而不是句子开头的动词。
关于nlp - 斯坦福 CorenNLP 短语 POS 标签和词形还原解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41597099/