java - 使用 JWI 和 Wordnet 获取词干

标签 java wordnet jwi

如何正确使用 stemmer method在麻省理工学院的 JWI(用于 WordNet 的 Java API)中实现以获得词干?我不确定如何初始化词干提取器和使用 findStems 方法。

最佳答案

您不需要额外的图书馆,但您确实需要一本字典。你可以从普林斯顿下载一个: https://wordnet.princeton.edu/wordnet/download/current-version/

我建议只下载“仅 WordNet 3.1 数据库文件”部分的词典 提取存档。假设 PATH/dict 是输出的位置,您可以使用此代码:

Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);

List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
    System.out.println(test.get(i));
}

这个例子的输出是“foot”。

关于java - 使用 JWI 和 Wordnet 获取词干,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11362168/

相关文章:

hadoop - 使用 RAMDictionary 和 hadoop

java - 是否可以在 JAXX 框架中使用 java 7 语法?

java - 从 JTextArea 获取插入符位置

Java String 忽略大小写实现

python - 在动词/名词/形容词形式之间转换单词

java - 如何通过 MIT JWI 查找 wordnet 同义词集的派生相关形式?

java - 格式错误的行异常 - Android 上的 JWI

java - @OneToMany 关联加入错误的字段

Wordnet Morphmaps : Why does WordNet 3. 0 的 morphmap 数量有限

nlp - 如何获取单词的语义类型?