nlp - 如何使用Stanford Parser获得POS标记

标签 nlp stanford-nlp

我正在使用Stanford Parser来解析单词对之间的依赖关系,但是我还需要标记单词。但是,在ParseDemo.java中,该程序仅输出“标记树”。我需要每个单词的标签是这样的:

My/PRP$ dog/NN also/RB likes/VBZ eating/VBG bananas/NNS ./.

不像这样:
(ROOT
  (S
    (NP (PRP$ My) (NN dog))
    (ADVP (RB also))
    (VP (VBZ likes)
      (S
        (VP (VBG eating)
          (S
            (ADJP (NNS bananas))))))
    (. .)))

谁能帮我?多谢。

最佳答案

如果您主要对在程序中操作标签感兴趣,并且不需要TreePrint功能,则只需将已标记的单词作为列表即可:

LexicalizedParser lp =
  LexicalizedParser.loadModel("edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz");
Tree parse = lp.apply(Arrays.asList(sent));
List taggedWords = parse.taggedYield();    

关于nlp - 如何使用Stanford Parser获得POS标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3733587/

相关文章:

python - 如何根据 python 和 NLPK 中 CSV 文件的训练数据预测位置

java - 检测代词及其名词?

java - 如何使用 StandfordNLP 解决共同引用后获得最终文本

c# - 分析文本(词形还原、编辑距离)

python - E053 无法读取 config.cfg Resumeparser

python - 如何在 NLTK 中使用 word_tokenize 忽略单词之间的标点符号?

parsing - 好的例子 : English Parsing/Natural Language Processing

python - 使用 nltk 的 2 个句子/字符串/文本之间的句法相似性/距离

python - 将连接的单词字符串分解为单个单词的快速方法

java - 从输出解析树中提取文本