如何正确使用 stemmer method在麻省理工学院的 JWI(用于 WordNet 的 Java API)中实现以获得词干?我不确定如何初始化词干提取器和使用 findStems 方法。
最佳答案
您不需要额外的图书馆,但您确实需要一本字典。你可以从普林斯顿下载一个: https://wordnet.princeton.edu/wordnet/download/current-version/
我建议只下载“仅 WordNet 3.1 数据库文件”部分的词典 提取存档。假设 PATH/dict 是输出的位置,您可以使用此代码:
Dictionary dict = new Dictionary(new File("PATH/dict"));
dict.open();
WordnetStemmer stemmer = new WordnetStemmer(dict);
List<String> test = stemmer.findStems("feet", POS.NOUN);
for (int i = 0; i < test.size(); i++) {
System.out.println(test.get(i));
}
这个例子的输出是“foot”。
关于java - 使用 JWI 和 Wordnet 获取词干,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11362168/