我在文本文件中有一个单词列表。我想要的是对于输入单词,与输入单词相似的单词列表。因此,该程序的工作方式应该类似于拼写检查器 API,唯一的区别是字典仅限于我的单词列表。
如果我得到一些指向拼写检查器算法或正则表达式的指针,我可以编写自己的代码。
最佳答案
看看 Apache Commons Lang StringUtils.getLevenshteinDistance
。 Levenshtein 算法给出了两个单词之间的“编辑距离”,即它们的相似程度。他们的实现速度相当快 - 我根据网上找到的另一个实现对其进行了测试,如果我没记错的话,速度大约快 1/3。
关于java - 寻找类似于拼写检查器的API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9506221/