【数据结构】了解KMP算法和部分匹配值、以及next函数值

最近生活发生了很多变化,没变的是自己还是咸鱼一条,害~~

1、什么是KMP算法

KMP算法是一种改进的字符串匹配算法。

2、KMP算法的思想

KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。

3、KMP算法的具体实现

实现一个next()函数,函数本身包含了模式串的局部匹配
信息

4、部分匹配值的定义

"部分匹配值"就是"前缀"和"后缀"的最长的共有元素的长度。

4.1 “前缀”和“后缀”的定义

"前缀"指除了最后一个字符以外,一个字符串的全部头部
组合;
"后缀"指除了第一个字符以外,一个字符串的全部尾部组
合。

4.2 相关例子

以"ABCDABD"为例,
-"A"的前缀和后缀都为空集,共有元素的长度为0;
-"AB"的前缀为[A],后缀为[B],共有元素的长度为0;
-"ABC"的前缀为[A, AB],后缀为[BC, C],共有元素的长度0; -"ABCD"的前缀为[A, AB, ABC],后缀为[BCD, CD, D],共有元
素的长度为0;
-“ABCDA"的前缀为[A, AB, ABC, ABCD],后缀为[BCDA, CDA,
DA, A],共有元素为"A”,长度为1;
-“ABCDAB"的前缀为[A, AB, ABC, ABCD, ABCDA],后缀为
[BCDAB, CDAB, DAB, AB, B],共有元素为"AB”,长度为2; -"ABCDABD"的前缀为[A, AB, ABC, ABCD, ABCDA, ABCDAB],后
缀为[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的长度为0。
在这里插入图片描述

5、移动位数的计算

公式(移动位数 = 已匹配的字符数 - 对应的部分匹配
值 )

6、next函数值相关计算题

例:在字符串的KMP模式匹配算法中,需先求解模式串p的
next函数值,其定义如下。若模式串p为“abaabaca”,则其
next函数值为(B)
在这里插入图片描述
A.01111111 B.01122341
C.01234567 D.01122334
解:
给定的字符串叫做模式串T。j表示next函数的参数,其值是从
1到n。而k则表示一种情况下的next函数值。p表示其中的某
个字符,下标从1开始。看等式左右对应的字符是否相等。
在这里插入图片描述
1、j=1时,next[1]=0;
2、j=2时,k的取值为(1,j)的开区间,所以整数k是不存在的,
那就是第三种情况,next[2]=1;
3、j=3时,k的取值为(1,3)的开区间,k从最大的开始取值,
然后带入含p的式子中验证等式是否成立,不成立k取第二大
的值。现在是k=2,将k导入p的式子中得,p1=p2,即
“a”=“b”,显然不成立,舍去。k再取值就超出范围了,所以
next[3]不属于第二种情况,那就是第三种了,即next[3]=1;
4、j=4时,k的取值为(1,4)的开区间,先取k=3,将k导入p
的式子中得,p1p2=p2p3,不成立。 再取k=2,得p1=p3,成
立。所以next[4]=2;
5、j=5时,k的取值为(1,5)的开区间,先取k=4,将k导入p
的式子中得,p1p2p3=p2p3p4,不成立。 再取k=3,得
p1p2=p3p4,不成立。 再取k=2,得p1=p4,成立。所以
next[5]=2;
6、j=6时,k的取值为(1,6)的开区间,先取k=5,将k导入p
的式子中得,p1p2p3p4=p2p3p4p5,不成立。 取k=4,得
p1p2p3=p3p4p5,不成立。再取k=3,将k导入p的式子中得,
p1p2=p4p5,成立。所以next[6]=3;
7、j=7时,k的取值为(1,7)的开区间,先取k=6,将k导入p
的式子中得,p1p2p3p4p5=p2p3p4p5p6,不成立。 再取k=5, 得 p1p2p3p4=p3p4p5p6 ,不成立。 再取k=4,得
p1p2p3=p4p5p6 ,成立。所以next[7]=4;
8、j=8时,k的取值为(1,8)的开区间, 先取k=7,将k导入
p的式子中得,p1p2p3p4p5p6=p2p3p4p5p6p7,不成立。 再 取k=6,得p1p2p3p4p5=p3p4p5p6p7,不成立。… 再取k=2, 得p1=p7,不成立。k再取值就超出范围了,所以next[8]不属
于第二种情况,那就是第三种了,即next[8]=1;
在这里插入图片描述


原文链接:https://blog.csdn.net/wy1948/article/details/119103985

posted @ 2022-08-22 11:39  独苏  阅读(167)  评论(0编辑  收藏  举报