【模板】KMP字符串匹配
题目描述
如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。
为了减少骗分的情况,接下来还要输出子串的前缀数组next。
(如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。)
输入输出格式
输入格式:
第一行为一个字符串,即为s1(仅包含大写字母)
第二行为一个字符串,即为s2(仅包含大写字母)
输出格式:
若干行,每行包含一个整数,表示s2在s1中出现的位置
接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。
输入输出样例
输入样例#1:
ABABABC ABA
输出样例#1:
1 3 0 0 1
说明
时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000
样例说明:
所以两个匹配位置为1和3,输出1、3
http://www.cnblogs.com/SYCstudio/p/7194315.html
http://blog.csdn.net/no1_terminator/article/details/52925547
http://blog.csdn.net/qq_30974369/article/details/74276186
KMP算法思维性很强,重点是理解next数组,提供以上3篇文章
就是要利用前面的比较,不要每一次都从开始判断,找到一个可以继续匹配的位置
根据条件next[j]=max(k) (p1p2......pk-1==pj-k+1.....pj-1)
就变成了自己匹配自己的问题
1 #include<iostream> 2 #include<cstdio> 3 #include<algorithm> 4 #include<cstring> 5 using namespace std; 6 int nxt[1001],l1,l2; 7 char s1[1000001],s2[1001],a[1000001],b[1001]; 8 void get_next() 9 {int i,j; 10 nxt[1]=0; 11 j=0; 12 for (i=2;i<=l2;i++) 13 { 14 while (j&&s2[i]!=s2[j+1]) j=nxt[j]; 15 if (s2[i]==s2[j+1]) j++; 16 nxt[i]=j; 17 } 18 } 19 void KMP() 20 {int i,j; 21 j=0; 22 for (i=1;i<=l1;i++) 23 { 24 while (j&&s1[i]!=s2[j+1]) j=nxt[j]; 25 if (s1[i]==s2[j+1]) j++; 26 if (j==l2) 27 { 28 printf("%d\n",i-l2+1); 29 j=nxt[j]; 30 } 31 } 32 } 33 int main() 34 {int i; 35 scanf("%s%s",a,b); 36 l1=strlen(a);l2=strlen(b); 37 for (i=1;i<=l1;i++) 38 s1[i]=a[i-1]; 39 for (i=1;i<=l2;i++) 40 s2[i]=b[i-1]; 41 get_next(); 42 KMP(); 43 for (i=1;i<=l2;i++) 44 printf("%d ",nxt[i]); 45 cout<<endl; 46 }