nlp - OpenNLP 词形还原示例

标签 nlp opennlp

有谁知道我在哪里可以找到如何在 OpenNLP 库中使用 SimpleLemmatizer() 类的示例,以及在哪里可以找到示例英语词典?文档中似乎缺少它。

最佳答案

您可以从这里下载字典 - en-lemmatizer.dict

例子 :

import opennlp.tools.lemmatizer.SimpleLemmatizer;

private static SimpleLemmatizer lemmatizer;

private String lemmatize(String word, String postag) throws IOException {
    if (lemmatizer == null) {
        InputStream is = getClass().getResourceAsStream("/models/en-lemmatizer.dict");
        lemmatizer = new SimpleLemmatizer(is);
        is.close();
    }
    String lemma = lemmatizer.lemmatize(word, postag);
    return lemma;
}

示例代码取自此处 - DocumentTaggerService

关于nlp - OpenNLP 词形还原示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38982423/

相关文章:

python - 在python中按句子结构对文本进行分类

java - 如何使用java删除包含非单词字符的行?

docker - 自动编辑dockerized容器中的文件

java - 向 Opennlp 提供名称列表

machine-learning - 如何使用 MLE 来训练 n-gram 模型?

java - 使用 OpenNLP 从解析的内容中删除停用词

machine-learning - 有没有办法增加预训练词嵌入的维度?

css - 如何使用 CSS 格式化 XML 文件?

java - 如何阅读 OpenNLP 中命名实体识别的文档

java - 我正在制作 NLP 应用程序,但模型太大