python - 使用 nltk pos 标记器标记单个单词而不是单词标记每个字母

我尝试使用 nltk pos 标记器标记单个词:

word = "going"
pos = nltk.pos_tag(word)
print pos

但是输出是这样的:

[('g', 'NN'), ('o', 'VBD'), ('i', 'PRP'), ('n', 'VBP'), ('g', 'JJ')]

它标记的是每个字母，而不仅仅是一个单词。

我该怎么做才能让它标记这个词？

最佳答案

nltk.tag.pos_tag接受 token 列表，分隔并标记其元素。因此，您需要将您的话放在一个可迭代的列表中:

>>> nltk.tag.pos_tag(['going'])
[('going', 'VBG')]

关于python - 使用 nltk pos 标记器标记单个单词而不是单词标记每个字母，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29397708/

相关文章：

Python 线程不想关闭