algorithm - 高效的模式匹配/字符串合并算法

标签 algorithm pattern-matching similarity knuth-morris-pratt

我正在寻找用于合并字符串的算法(最好使用 Java 实现)。

我的问题如下:

假设我有一个字符串数组/列表{"myString1", "my String1", "my-String-1"... } 我希望该算法指出很有可能 所有这些值都表示“myString1”。

所以我想压缩我的列表。 也许这可以用 KMP 来完成,或者也许有更合适的东西。

谢谢。

最佳答案

我认为 Edit distance是合并字符串的良好启发式方法。

编辑:

您可以修改编辑距离算法:

你可以为字符 c 赋予不同的 d(-,c) 值。

所以在下面的例子中:“String1”,“String2”,你可以“惩罚”分数,但让 d(1,2) 很高,与此相反,“String 1”,“String1”不会受到惩罚,因为分数将是 d(-,' ')。

关于algorithm - 高效的模式匹配/字符串合并算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11835780/

相关文章:

C++ 2 Dimensional Map 找到给定索引的所有相邻方 block

scala - 为什么使用管道将变量绑定(bind)到 Scala 模式中的异常类型会被推断为类型 "Throwable"?

f# - 通过模式匹配比较 F# 区分的联合实例

python - Pandas 中的序列相似度匹配

算法 - 根据最相似的偏好对用户进行分组

algorithm - 在 KML 多边形上查找最近的点

algorithm - 关于如何进行面向对象分析和算法设计的书籍/教程?

haskell - 如何有效地组合 haskell 模式匹配

machine-learning - 我可以使用SVM进行相似度匹配吗

python - 后缀树 : locating a substring if a certain number of mistakes are allowed