nlp - 如何使用Stanford Parser获得POS标记

我正在使用Stanford Parser来解析单词对之间的依赖关系，但是我还需要标记单词。但是，在ParseDemo.java中，该程序仅输出“标记树”。我需要每个单词的标签是这样的:

My/PRP$ dog/NN also/RB likes/VBZ eating/VBG bananas/NNS ./.

不像这样:

(ROOT
  (S
    (NP (PRP$ My) (NN dog))
    (ADVP (RB also))
    (VP (VBZ likes)
      (S
        (VP (VBG eating)
          (S
            (ADJP (NNS bananas))))))
    (. .)))

谁能帮我？多谢。

最佳答案

如果您主要对在程序中操作标签感兴趣，并且不需要TreePrint功能，则只需将已标记的单词作为列表即可:

LexicalizedParser lp =
  LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");
Tree parse = lp.apply(Arrays.asList(sent));
List taggedWords = parse.taggedYield();

关于nlp - 如何使用Stanford Parser获得POS标记，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3733587/

上一篇：binary-tree - 填充二叉树使其成为bst的方法数量

下一篇：cuda - nvcc -Xptxas –v编译器标志无效

java - 检测代词及其名词？

java - 如何使用 StandfordNLP 解决共同引用后获得最终文本

c# - 分析文本(词形还原、编辑距离)

python - E053 无法读取 config.cfg Resumeparser

python - 如何在 NLTK 中使用 word_tokenize 忽略单词之间的标点符号？

parsing - 好的例子 : English Parsing/Natural Language Processing

python - 使用 nltk 的 2 个句子/字符串/文本之间的句法相似性/距离

python - 将连接的单词字符串分解为单个单词的快速方法

java - 从输出解析树中提取文本