java - 使用斯坦福类型的解析器从文本文件中提取名词短语

标签 java text nlp stanford-nlp opennlp

我有一段文本,我想从中提取名词短语。我可以很容易地获得我所拥有的文本的类型化解析器,但想知道如何提取文本中的名词短语?

最佳答案

您可以使用以下代码从 Tree 中提取名词短语。它假定您已经解析了存储在 parse 中的句子(即 parse 是 LexicalizedParser 类应用方法的输出)

public static List<Tree> GetNounPhrases()
{

    List<Tree> phraseList=new ArrayList<Tree>();
    for (Tree subtree: parse)
    {

      if(subtree.label().value().equals("NP"))
      {

        phraseList.add(subtree);
        System.out.println(subtree);

      }
    }

      return phraseList;

}

关于java - 使用斯坦福类型的解析器从文本文件中提取名词短语,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10974532/

相关文章:

Java method().method() 调用

Java正则表达式从URL解析特定分号分隔的参数?

python - 如何使用 NLTK 搭配获取 trigrams 的 PMI 分数? Python

python - 我们如何使用 Spacy minibatch 和 GoldParse 来训练使用 BILUO 标记方案的 NER 模型?

java - 将字符串中的单个字符转换为小写

Java 日历配置

android - 如何将数据追加到新行中的文本文件中,(\n 不起作用)

html - 在 CSS 中使文本在视频上居中

javascript - 删除 HTML5 Canvas 中的文本?

python - 如何在 AllenNLP 中训练语义角色标注模型?