KMP

KMP算法

是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特—莫里斯—普拉特操作(简称KMP算法)。

KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息。

KMP算法的时间复杂度O(m+n)。

1、next[ ]数组的计算:

每个字串的:前缀子串和后缀字串的最大相同字符长度。然后整体左移一位,最开始写next[0]= -1;

模式串为:a b a c a b;

a                      没有字串: 0

a b                    [a ] , [b ] :   0

a b a                 [a , ab] , [ba, a] : 1

a b a c              [a, ab, aba] , [bac, ac, c]: 0

a b a c a           [a, ab, aba, abac], [baca, aca, ca, a]: 1

a b a c a b        移位覆盖,不用计算: 

模式串 a b a c a b
next[ ] 0 0 1 0 1  

 

 

 

左移:

模式串 a b a c a b
next[ ] -1 0 0 1 0

 

 

计算next数组的程序:len表示当前的最大匹配长度,i为滑动游标,进行一个一个的比较。当不相等时,需要比较len=prefix[len-1];考虑出现len-1为负数的情况,要做判断,当len==0时,直接赋值并i++;

 

然后需要移位。

 

 

 

posted @ 2020-04-14 15:57  kkzhang  阅读(136)  评论(0编辑  收藏  举报