python - 词性标注——NLTK 认为名词是形容词

标签 python nltk

在下面的代码中,为什么 nltk 认为 'fish' 是形容词而不是名词?

>>> import nltk
>>> s = "a woman needs a man like a fish needs a bicycle"
>>> nltk.pos_tag(s.split())
[('a', 'DT'), ('woman', 'NN'), ('needs', 'VBZ'), ('a', 'DT'), ('man', 'NN'), ('like', 'IN'), ('a', 'DT'), ('fish', 'JJ'), ('needs', 'NNS'), ('a', 'DT'), ('bicycle', 'NN')]

最佳答案

我不确定解决方法是什么,但您可以在此处查看源代码 https://nltk.googlecode.com/svn/trunk/nltk/nltk/tag/

与此同时,我用几乎不同的方法尝试了你的句子。

>>> s = "a woman needs a man. A fish needs a bicycle"
>>> nltk.pos_tag(s.split())
[('a', 'DT'), ('woman', 'NN'), ('needs', 'VBZ'), ('a', 'DT'), ('man.', NP'), ('A','NNP'),   ('fish', 'NN'), ('needs', 'VBZ'), ('a', 'DT'), ('bicycle', 'NN')]

这导致鱼为“NN”。

关于python - 词性标注——NLTK 认为名词是形容词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13529945/

相关文章:

python - 如何去除标点符号?

python - python中的字符串替换性能

python - Django REST Framework-如何在 POST 父级时创建或更新外键对象

python - 在 SQLAlchemy 基类中定义抽象方法

python - res_similarity() 函数的参数

nltk - 我们如何使用使用自定义数据集训练斯坦福 NER 标记器后生成的输出文件?

python - sympy 中有多个用于 lambdify 的模块

python - 如何强制 Pandas "read_csv"函数保留空白值

python - LookupError : from nltk. 图书导入*

python - NLTK 正则表达式分块器不在一个命令中处理多个语法规则