algorithm - KMP算法前缀表

标签 algorithm string-matching

我正在研究 KMP 算法。尽管这个算法很好理解，但我在这里有一个疑问。

前缀表算法:

void prefixTable(char p[], int m){
     int i=1, j=0, F[0] = 0;
     while(i<m){
        if(p[i]==p[j]){
            F[i]=j+1;
            i++;
            j++;
        }else if(j>0){
            j=F[j-1];
        }else{
            F[i]=0;
            i++;
        }
     }
}

如上图第5步所示，i=5,j=3,j=F[j-1]被执行为j>0。

为什么要取F[j-1]？为什么我们不能直接使用F[0]呢？它如何保证算法的正确性？

最佳答案

j 是模式中的位置。

如果模式被处理到某个位置 > 0，那么如果模式包含其自身的前缀，我们就不能将模式移动到第一个 (0) 位置。

应用于您的示例:模式是 ababaca。尝试在文本 abababaca 中找到它:

算法将处理文本直到 ababa|baca，其中模式为 ababa|c
将 j 设置为 F[0] = 0，意味着将模式设置为 |ababac，它永远不会匹配 baca(注意 i 不会被更改)<
将 j 设置为 F[4] = 3，意味着将模式设置为 aba|bac，这将匹配 baca
匹配后，模式处于状态 ababac|，文本处于状态 ababac|a，很明显找到的模式是 ab[ababac ]a

关于algorithm - KMP算法前缀表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38982121/

上一篇：javascript - 快速选择到 JavaScript

下一篇：algorithm - 数组中每一对的优化算法

相关文章：

计算h-score(h-index)的SQL

Python:MergeSort 数据输入

python - 使用 fuzzywuzzy 的字符串匹配 - 它是使用 Levenshtein 距离还是 Ratcliff/Obershelp 模式匹配算法？

python - 如何区分子字符串和确切的单词？

algorithm - (with example) 为什么 KMP 字符串匹配 O(n)。不应该是 O(n*m) 吗？

java - 该算法的基本情况是什么？

java - 矩阵中 1 的组数/岛数 : Definition clarification

algorithm - 裁剪是在 Three.js 中自动完成的吗？

java - Unicode字符串匹配

Powershell 二进制 grep

©2024 IT工具网联系我们