<分区>
Possible Duplicate:
Extracting nouns from Noun Phase in NLP
有没有人有一些关于如何使用 Python 的 NLTK 从字符串中提取所有名词的示例? ?
例如,我有这个字符串:“I Like Tomatoes and Lettuce”。我想构建一个返回“西红柿”和“生菜”的方法。
如果不是 Python,有没有人知道任何其他解决方案?
<分区>
Possible Duplicate:
Extracting nouns from Noun Phase in NLP
有没有人有一些关于如何使用 Python 的 NLTK 从字符串中提取所有名词的示例? ?
例如,我有这个字符串:“I Like Tomatoes and Lettuce”。我想构建一个返回“西红柿”和“生菜”的方法。
如果不是 Python,有没有人知道任何其他解决方案?
最佳答案
获取NLTK包,然后使用其内置的解析器 this method ;或者,更快,part-of-speech tag字符串并取出所有带有标签 NN
的单词;这些是名词。阅读其他词性标签,了解如何正确提取 I
和 like
。
这两种方法都不是完美无缺的,但它是您能做的最好的。一个好的词性标注器在干净输入上的准确率将在 95% 以上。我不认为如果没有很多额外的工作,您无法使用基于 WordNet 的方法达到如此准确。
关于python - 从字符串中提取所有名词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5884533/