java - 如何从Wordnet中获取按出现概率排序的同义词

标签 java nlp wordnet

我正在 Wordnet 中搜索大量单词的同义词。我这样做的方式是,当某个单词有多个同义词时,结果按字母顺序返回。我需要的是按它们的出现概率 对它们进行排序,我只取前 1 个同义词。

我已经使用了prolog wordnet数据库和Syns2Index将其转换为Lucene类型的索引来查询同义词。有没有办法让它们以这种方式按概率排序,或者我应该使用另一种方法?

速度不重要,这个同义词查找不会在线完成。

最佳答案

万一有人无意中发现了这个话题,这是解决方法(至少我需要的):

http://lyle.smu.edu/~tspell/jaws/doc/edu/smu/tspell/wordnet/impl/file/ReferenceSynset.html#getTagCount%28java.lang.String%29

tagCount 方法为每个单词提供最可能的同义词集组。再次出现的问题是,具有高概率的同义词集可以有多个单词。但我想没有机会避免这种情况

关于java - 如何从Wordnet中获取按出现概率排序的同义词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3234371/

相关文章:

java - 如何 "skip"规则以使一个规则优于另一个规则?

python-3.x - 如何在 Pandas 数据帧上迭代 TfidfVectorizer()

python - NLTK - block 语法不读取逗号

python - wordnet中的lemma和synset有什么联系或区别?

python - 如何通过 also-see 和 similar-to 关系获取与引用同义词集相关的同义词集? ( python NLTK)

java - 如何将根 SSL 证书作为资源包含在 J2ME 应用程序中?

java - 如何使用 JNI 创建对象?

java - 如何从 Java 反射中隐藏方法?

java - 创建另一个train.txt来训练其他领域的情感模型

python - 使用 BeautifulSoup 时遇到错误