KMP

KMP算法

是一种改进的字符串匹配算法，由D.E.Knuth，J.H.Morris和V.R.Pratt提出的，因此人们称它为克努特—莫里斯—普拉特操作（简称KMP算法）。

KMP算法的核心是利用匹配失败后的信息，尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现，函数本身包含了模式串的局部匹配信息。

KMP算法的时间复杂度O(m+n)。

1、next[ ]数组的计算：

每个字串的：前缀子串和后缀字串的最大相同字符长度。然后整体左移一位，最开始写next[0]= -1；

模式串为：a b a c a b；

a 没有字串： 0

a b [a ] , [b ] : 0

a b a [a , ab] , [ba, a] : 1

a b a c [a, ab, aba] , [bac, ac, c]: 0

a b a c a [a, ab, aba, abac], [baca, aca, ca, a]: 1

a b a c a b 移位覆盖，不用计算:

模式串	a	b	a	c	a	b
next[ ]	0	0	1	0	1

左移：

模式串	a	b	a	c	a	b
next[ ]	-1	0	0	1	0	1

计算next数组的程序：len表示当前的最大匹配长度，i为滑动游标，进行一个一个的比较。当不相等时，需要比较len=prefix[len-1]；考虑出现len-1为负数的情况，要做判断，当len==0时，直接赋值并i++;

然后需要移位。

posted @ 2020-04-14 15:57 kkzhang 阅读(136) 评论(0) 编辑收藏举报

刷新页面返回顶部

Dream