我正在尝试计算字符串与集合的编辑距离,以找到最接近的匹配项。我目前的问题是集合非常大(大约 25000 项),所以我不得不将集合缩小到只有相似长度的字符串,但这仍然只会将它缩小到几千个字符串,而且这仍然非常慢。是否有允许快速查找相似字符串的数据结构,或者是否有其他方法可以解决此问题?
最佳答案
听起来像 BK-tree可能是你想要的。这是一篇讨论它们的文章:http://blog.notdot.net/2007/4/Damn-Cool-Algorithms-Part-1-BK-Trees . quick Google产生一些 Java 实现。
关于java - 快速将字符串与 Java 中的集合进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9139423/