我一直在使用Stanford POS Tagger标记句子中的词性。我从有关 stackoverflow 主题的文档和其他问题中了解到,以下代码给出了句子的 POS 标记
MaxentTagger tagger = new MaxentTagger("./left3words-wsj-0-18.tagger");
String tags=tagger.tagString(Summary);
但我想要的是获取单个单词的 POS 标签。一种可能的方法是分解输入字符串并逐字向标记器输入,但这看起来并不优雅,而且我认为这会增加出错的机会。 Javadoc说 apply 函数可以返回 TaggedWords 的 ArrayList,但我无法成功调用此函数。 知道如何使用斯坦福 POS 获得字符串中各个单词的 POS 标记吗 通过应用函数或其他函数进行标记?
最佳答案
看起来您应该将 tokenizeText() 与 tagSentence() 一起使用来获取标记单词的列表。查看 postagger 发行版中包含的 TaggerDemo.java。
关于java - 如何获取句子中单个单词的 PoS 标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11295817/