AcWing 831.KMP字符串
AcWing 831.KMP字符串
题目描述
给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式
第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串S。
输出格式
共一行,输出所有出现位置的起始下标(下标从0开始计数),整数之间用空格隔开。
数据范围
1≤N≤104
1≤M≤105
输入样例:
3
aba
5
ababa
输出样例:
0 2
思路
利用KMP算法解决,这里讲一下自己理解的KMP算法
暴力的思路
一般匹配字符串时,我们从目标字符串str(假设长度为n)的第一个下标选取和ptr长度(长度为m)一样的子字符串进行比较,如果一样,就返回开始处的下标值,不一样,选取str下一个下标,同样选取长度为n的字符串进行比较,直到str的末尾(实际比较时,下标移动到n-m)。这样的时间复杂度是O(n*m)。
KMP
充分利用了目标字符串ptr的性质(比如里面部分字符串的重复性,即使不存在重复字段,在比较时,实现匹配串的最大的移动量)
这样就能利用next数组存在ptr中每一位的相同的最长前缀和后缀,为了方便我们数组的下标从1开始
next数组的求法
ne[1] = 0;//这里从1开始
for (int i = 2, j = 0; i <= n; ++i) {
while (j && p[j + 1] != p[i]) j = ne[j];
if (p[j + 1] == p[i]) j++;
ne[i] = j;
}
上述代码中用j + 1是因为我们发现当字符不匹配的时候,前一个位置的next[j]值(不是这样也行,个人习惯),如果不匹配就像前退,知道匹配或者j = 0(j = 0就是退无可退,已经到最前面了),可以利用前面已经匹配的数据更快的找出位置(感觉有点像DP)。
匹配的时候,因为前面的已经匹配了j向后走,如果不匹配就向前退。
匹配
图解:
for (int i = 1, j = 0; i <= n; i ++ )
{
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j ++ ;
if (j == m)
{
j = ne[j];
// 匹配成功后的逻辑
}
}
题解
#include <iostream>
#include <string>
using namespace std;
const int N = 10010;
const int M = 100010;
int ne[N];//把每一个点为终点的最长相同前缀和后缀的长度存在里面
char s[M], p[N];
int main() {
int n, m;
cin >> n >> p + 1 >> m >> s + 1;
ne[1] = 0;//这里从1开始
for (int i = 2, j = 0; i <= n; ++i) {
while (j && p[j + 1] != p[i]) j = ne[j];
if (p[j + 1] == p[i]) j++;
ne[i] = j;
}
for (int i = 1, j = 0; i <= m; ++i) {
while (j && s[i] != p[j + 1]) j = ne[j];
if (s[i] == p[j + 1]) j++;
if (j == n) {
j = ne[j];
cout << i - n << ' ';
}
}
return 0;
}
如有错误,欢迎指正!