【字符串匹配】KMP
2024-8-28 ·最后更新时间 2024-8-28
Knuth-Morris-Pratt 字符串查找算法,简称为KMP算法,常用于在一个文本串 S 内查找另一个文本 P 的出现位置,因为时间复杂度优异而被广泛使用。
这个算法由 Donald Knuth、Vaughan Pratt、James H. Morris 三人于 1977 年联合发表,故取这 3 人的姓氏命名此算法。
在正式学习 KMP 算法之前我们要对前缀函数有一定的了解。
比如给你一个字符串:
那么前缀后缀相同时的最长长度是多少?很显然一定
那么在数学中我们就会给这种形式的数值常用
那么我们如果把所有
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
---|---|---|---|---|---|---|---|
这就是我们的前缀函数,但是...它和 KMP 有什么关系呢?
接下来我就要根据前缀函数来推演出 KMP 算法。
假设文本串
考虑什么时候
我们可以这样,先用一个奇妙字符给他们衔接起来就变成了
然后我们就可以轻而易举地根据前缀函数得知,当且仅当
我们可以浅浅证明一下,因为前缀函数的定义就是到了
那么接下来的问题就是如何求
我们可以把字符串想象成一些点,那么就变成了:
那么如果我们现在知道
那么轻而易举地我们可以知道当
for(int i=1;i<=s.size();++i){
int len=pi[i-1];
if(s[i]==s[len]){
pi[i]=len+1;
}
}
BUT 不相等怎么办?那我们是不是尽量考虑次小的
for(int i=1;i<=s.size();++i){
int len=pi[i-1];
while(s[i]!=s[len]){
len=next_pi(i-1);
}
if(s[i]==s[len]){
pi[i]=len+1;
}
}
接下来我们就要解决 next_pi(x) 这个函数怎么求,我们可以再画一个图:
别问为什么图变了,如果我们仔细观察
for(int i=1;i<=s.size();++i){
int len=pi[i-1];
while(len&&s[i]!=s[len]){
len=pi[len-1];
}
if(s[i]==s[len]){
pi[i]=len+1;
}
}
那么,如果你完完整整的看完了这篇博客,你可能会觉得这和你印象中的 KMP 不太一样,但是如果你把到
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具