java - 如何获取句子中单个单词的 PoS 标签?

标签 java nlp

我一直在使用Stanford POS Tagger标记句子中的词性。我从有关 stackoverflow 主题的文档和其他问题中了解到,以下代码给出了句子的 POS 标记

            MaxentTagger tagger = new MaxentTagger("./left3words-wsj-0-18.tagger");
                     String tags=tagger.tagString(Summary);

但我想要的是获取单个单词的 POS 标签。一种可能的方法是分解输入字符串并逐字向标记器输入,但这看起来并不优雅,而且我认为这会增加出错的机会。 Javadoc说 apply 函数可以返回 TaggedWords 的 ArrayList,但我无法成功调用此函数。 知道如何使用斯坦福 POS 获得字符串中各个单词的 POS 标记吗 通过应用函数或其他函数进行标记?

最佳答案

看起来您应该将 tokenizeText() 与 tagSentence() 一起使用来获取标记单词的列表。查看 postagger 发行版中包含的 TaggerDemo.java。

关于java - 如何获取句子中单个单词的 PoS 标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11295817/

相关文章:

java - 我如何包装一个方法,以便在它超过指定超时时终止它的执行?

php - 提出的用于文本标记的 nlp 算法

python - 如何向 NLTK 中的停用词添加更多语言?

java - toast 继承主题背景

java - 静态引用被清除——如果未使用,Android 是否会在运行时卸载类?

java - 通过socket编程访问远程目录

Java:HashMap 声称它有 key ,但不知何故没有

python - PyParsing:这是对 setParseAction() 的正确使用吗?

python - 判断一个词是否是名词

nlp - 如何消除 Conceptnet 中的单词歧义