我正在寻找用于合并字符串的算法(最好使用 Java 实现)。
我的问题如下:
假设我有一个字符串数组/列表{"myString1", "my String1", "my-String-1"... } 我希望该算法指出很有可能 所有这些值都表示“myString1”。
所以我想压缩我的列表。 也许这可以用 KMP 来完成,或者也许有更合适的东西。
谢谢。
最佳答案
我认为 Edit distance是合并字符串的良好启发式方法。
编辑:
您可以修改编辑距离算法:
你可以为字符 c 赋予不同的 d(-,c) 值。
所以在下面的例子中:“String1”,“String2”,你可以“惩罚”分数,但让 d(1,2) 很高,与此相反,“String 1”,“String1”不会受到惩罚,因为分数将是 d(-,' ')。
关于algorithm - 高效的模式匹配/字符串合并算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11835780/