。。。

导航

【字符串】【扩展kmp算法总结~~】

这两天呢,一直在被小伙伴们快ak的恐惧支配,G题杭电的数据很水,但是自己还是选择不水过,用扩展kmp去写,网上的资料很多,自己选了一个最简洁的模板,不用再写一个求next数组的函数,直接调用前特殊处理下exkmp函数就既可以求next数组,又可以求ex数组啦,hh谁说鱼与熊掌不可兼得,这不就是吗~但是呢,一开始一点也不好理解哎,自己选的模板,跪着也得理解完~~~(泪目~~

————言归正传,总结——————

1.扩展kmp算法呢是对kmp算法的扩展,扩展kmp算法也有一个和kmp函数名字一样的next数组,还有一个ex数组。

2.扩展kmp算法的可以用o(m+n)的复杂度求出字符串s1任意后缀和字符串s2的最长公共前缀。

3:扩展kmp算法里ex数组:ex[i] == j表示s1以i为起始的后缀与s2的最长公共前缀。

扩展kmp算法里next数组:next[i] == j表示s2以i为起始的后缀与s2的最长公共前缀

两者作用都一样当然可以调用同一个函数咯~

   kmp算法里next数组:next[i] == j表示s2在0~i之前已匹配的前缀后缀长度为j+1(前提是next[0]初始化为-1,如果初始化为0,已匹配的长度就为j)

————加深理解,模拟算法实现过程————

用样例s1=aaaabaa,s2=aaaaa直接进行模拟算法实现过程,前提是要结合模板

 

第一步:由于exkmp函数的作用是在已知s2的next数组的情况下,求出字符串s1的任意后缀与字符串s2的最长公共前缀,存入ex,所以我们需要先调用函数求出next数组

主函数里调用过程如下,预先初始化next[0]=0;

void exkmp(char s1[],char s2[],int ex[],int next[])

 

 

这样调用的原因参见总结3,生成next数组的过程相当于将s2与s2自身进行匹配,s2+1     == 形参s1

s2        == 形参s2

 

next+1 == 形参ex

 

next     == 形参next.

接收过程如下:

void exkmp(char s1[],char s2[],int ex[],int next[]);

 

 

 

a.在此函数中我们传递给形参s1的是s2+1,结合下图所示样例s1=aaaa,s2=aaaaa来看,即s1[0..] == (s2+1)[1..]

 

b.传递给形参ex的是next+1,也就是next数组后移一位,即ex[i] == next[i+1](有点难懂,解释下,

我们将形参s1和形参s2进行匹配时,实际就是实参数组s2[1...]的后缀与实参数组本身s2[0..]的前缀进行匹配,所以我们匹配出的最大公共长度min(next[j],p)赋值给形参数组ex[i]时,实际就是赋值给next[i+1],(这里不知道为什么取最小值不要紧,稍后进行解释),结合下图两张图片来看,明显e数组的值存入next数组的后一位。

 

 

e[1]      = 3     e[2]      = 2   e[3]      = 1

 

 

next[2] = 3     next[3] = 2   next[4] = 1

 

 

 

 

 

 

第二步:在已知s2的next数组的情况下,再次调用函数,求出s1的任意后缀和s2的最长公共前缀,存入ex。
在函数调用过程中,我们比较s1[i..]与s2的最长公共前缀部分时,只取较小的值,原因是,只有s2的自身前缀长度与p(s2和s1的公共前缀长度)都是公共长度的时候,这个值才能保证就是s1[i..]与s2的最长公共前缀部分。
当它们相等时,无法直接比较判断出最长公共前缀部分,因为p之后也有可能有公共长度,所以我们只需要继续从p开始逐一比较。

 

 

 

/*主函数里初始化和调用*/
/*next[0] = 0;
exkmp(s2+1,s2,next+1,next);
exkmp(s1,s2,ex,next);*/

void exkmp(char s1[],char s2[],int ex[],int next[])
{
    int i,j,p;
    i = j = 0;
    p = -1;
    while(s1[i]!='\0')
    {
        if( p == -1)
        {
            j = 0;
            do
                p++;
            while(s1[i+p] != '\0'&&s1[i+p] == s2[j+p]);
            ex[i] = p;
        }
        else if(next[j] < p)
            ex[i] = next[j];
        else if(next[j] > p)
            ex[i] = p;
        else
        {
            j = 0;
            while(s1[i+p] != '\0'&&s1[i+p] == s2[j+p])
                p++;
            ex[i] = p;
        }    
        
        i++;
        j++;
        p--;
    }
    ex[i] = 0;
    return;
}

 

posted on 2017-08-10 18:09  大学僧  阅读(412)  评论(0编辑  收藏  举报