nlp - 斯坦福 CorenNLP 短语 POS 标签和词形还原解释

标签 nlp stanford-nlp

我在短语词形还原过程中得到了这个结果:

Gathered requirements

使用corenlp online tool ,该短语的词性标记和词形还原导致:

enter image description here

出于某种原因,“Gathered”被赋予了“JJ”(“形容词”)的词性标签,这可能会导致引理被“gathered”而不是“gather”。

如果输入短语是gathered requests(即小写),则词性标记被正确识别为动词,并且词形还原结果就是我所期望的:

enter image description here

为什么 CoreNLP 将 Gathered 识别为形容词而不是动词?

最佳答案

当您写下“已收集的需求”时,系统会检查“已收集”一词出现次数最多的 POS 标签的概率。只有某些类型的单词(例如命名实体、句子开头等)以大写字母开头。当你以大写字母开头时,“Gathered”更可能是 JJ 的一般原因是它主要用作形容词而不是句子开头的动词。

关于nlp - 斯坦福 CorenNLP 短语 POS 标签和词形还原解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41597099/

相关文章:

c# - 在多个问题中引用 Corefs

java - 解析后从单词中获取开始位置和/或 NER

java - 如何在 Eclipse/Netbeans IDE for Java NLP 项目中添加 stanford corenlp 库?

keras - 如何可视化注意力权重?

python - 训练新的 AutoTokenizer 拥抱脸部

python - 如何使用 nltk 正则表达式模式来提取特定的短语 block ?

tensorflow - 如何使用依存分析树进行情感分析?

python - 由于内存问题,如何保存仅与预训练bert模型的分类器层相关的参数?

python - 斯坦福解析器的 nltk 接口(interface)

stanford-nlp - nltk stanford ner tagger 和 stanford ner tagger 在线演示之间的不一致