string - 两个词有多相似

标签 string algorithm

有比“编辑距离”算法更准确的算法吗?? http://en.wikipedia.org/wiki/Levenshtein_distance

最佳答案

Damerau–Levenshtein distance ,它增加了对字符转换的支持,并为常见的拼写错误提供了更多的覆盖范围。

要获得 LevenshteinDamerau-Levenshtein 的相似度百分比,请执行以下操作:

int relative_similarity = 1.0 - 1.0 / ((len(x) + len(y)) / 2) * lev(x, y); //untested

或者你可能想看看 longest common subsequence作为相似度的度量。

接下来是

这是语音匹配算法。

虽然 Smith 和它的德国同行 Schmidt 使用编辑距离(又名 Levenshtein)会出现完全不同,但 Soundex 和 MEtaphone 会认为它们在语音上相似甚至等效.


但如果您不告诉我们纯编辑距离有什么错误,就很难猜出更好的算法。

关于string - 两个词有多相似,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8408656/

相关文章:

c# - 在 C# 中提取仅包含字母的字符串

algorithm - 关于如何提高点击机器人性能的建议

有人可以检查一下算法吗

java - 测试游戏算法速度

java - 如何更改全部大写的字符串以利用第一个字母然后是每个空格后面的第一个字母? ( java )

c# - 从 C# 调用 C DLL 函数 - 将 char 参数转换为字符串

python - 在 Python 2.7 中使用加号 (+) 连接两个字符串是否合适,而不是使用大括号 ({}) 和 `format` 连接?

javascript - 如何使用 JavaScript 将字符添加到字符串的随机空间?

algorithm - CountingElements 解决方案

c# - 需要数学库来操作序列/范围