hihocoder 1015 KMP(找多个位置的 【*模板】)
#1015 : KMP算法
时间限制:1000ms
单点时限:1000ms
内存限制:256MB
描述
小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。
这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?”
小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就肯定不会这么容易的让他们回答了,于是他们只能说 道:“抱歉,河蟹先生,我们只能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开判断,然后依次枚举起始位置并检查是否能够匹配,但是这不是您想要的方法是吧?”
河蟹点了点头,说道:”看来你们的水平还有待提高,这样吧,如果我说只有一个特殊文字,你能不能做到呢?“
小Ho这时候还有点晕晕乎乎的,但是小Hi很快开口道:”我知道!这就是一个很经典的模式匹配问题!可以使用KMP算法进行求解!“
河蟹满意的点了点头,对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“
”保证完成任务!”小Hi点头道。
输入
第一行一个整数N,表示测试数据组数。
接下来的N*2行,每两行表示一个测试数据。在每一个测试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。
其中N<=20
输出
对于每一个测试数据,按照它们在输入中出现的顺序输出一行Ans,表示模式串在原串中出现的次数。
- 样例输入
-
5 HA HAHAHA WQN WQN ADA ADADADA BABABB BABABABABABABABABB DAD ADDAADAADDAAADAAD
- 样例输出
-
3 1 3 1 0
#include <iostream> #include <string> #include <cstdio> #include <cstring> #include <algorithm> #include <stack> using namespace std; void GET_next(string t, int next[]) { int j, k; j=0; k=-1; next[0]=-1; int len=t.size(); while(j<len ) { if(k==-1 || t[j]==t[k] ) { j++; k++; next[j]=k; } else k=next[k]; } } int KMP(string s, string t, int next[] ) { int i, j; i=0; j=0; int len1=s.size(); int len2=t.size(); int cnt=0; while(i<len1 ) { if(j==-1 || s[i]==t[j] ) { i++; j++; } else if(j<len2) j=next[j]; if(j==len2 ) { cnt++; j=next[len2]; } } return cnt; } int main() { string s, t; int i, j; int len1, len2; int next[10002]; int tt; cin>>tt; while(tt--) { cin>>t; cin>>s; len1=s.size(); len2=t.size(); GET_next(t, next); printf("%d\n", KMP(s, t, next)); } return 0; }
第二种写法:基于STL的结构实现
#include <stdio.h> #include <string.h> #include <stdlib.h> #include <iostream> #include <string> #include <vector> #include <iomanip> #include <algorithm> using namespace std; //实现一种算法使得能够在线性的时间复杂度内:求出一个串在两一个串的所有匹配位置 // O(N+M) //pattern 模式串 //text 文本串 int find_substring(string pattern, string text ) { int n=pattern.size(); vector<int>next(n+1, 0); for(int i=1; i<n; i++) { int j=i; while(j>0) { j=next[j]; if(pattern[j] == pattern[i]) { next[i+1] = j+1; break; } } } int cnt=0; int m = text.size(); for(int i=0, j=0; i<m; i++) { if(j<n && text[i]==pattern[j] ) j++; else { while(j>0) { j=next[j]; if(text[i] == pattern[j] ) { j++; break; } } } if(j==n) cnt++; } return cnt; } int main() { int tt; scanf("%d%*C", &tt); string t, s; while(tt--) { cin>>t; cin>>s; int dd; dd=find_substring(t, s); printf("%d\n", dd); } return 0; }
如果模式串在主串中有多个位置,不是要输出出现的次数,而是要输出每个位置!在上面代码的基础上打表存储一下即可!
vector<int> find_substring(string pattern, string text ) //返回一个vector数组 { int n=pattern.size(); vector<int>next(n+1, 0); for(int i=1; i<n; i++) { int j=i; while(j>0) { j=next[j]; if(pattern[j] == pattern[i]) { next[i+1] = j+1; break; } } } vector<int>position; int m = text.size(); for(int i=0, j=0; i<m; i++) { if(j<n && text[i]==pattern[j] ) j++; else { while(j>0) { j=next[j]; if(text[i] == pattern[j] ) { j++; break; } } } if(j==n) position.push_back(i-n+1); //打表存储位置 } return position; //返回存储位置的vector数组 }