2017.2.12【初中部 GDKOI】模拟赛B组 T3:seek
seek
Description
俗话说“好命不如好名”,小h准备给他的宠物狗起个新的名字,于是他把一些英文的名字全抄下来了,写成一行长长的字符串,小h觉得一个名字如果是好名字,那么这个名字在这个串中既是前缀,又是后缀,即是这个名字从前面开始可以匹配,从后面开始也可以匹配,例如abc在 abcddabc中既是前缀,也是后缀,而ab就不是,可是长达4*10^5的字符让小h几乎昏过去了,为了给自己的小狗起个好名字,小h向你求救,并且他要求要将所有的好名字的长度都输出来。
Input
一行,要处理的字符串(都是小写字母)。
Output
一行若干个数字,从小到大输出,表示好名字的长度。
Sample Input
abcddabc
Sample Output
3 8
题解:
对于40%:直接一个纯模拟就可以了。
对于100%:40分的方法我们时间会炸,那么考虑一下线性的方法就可以过了。这是,我们可以想到一个很快速的方法——KMP。
KMP是一个很快速的方法,可以线性的方法找到一个字符串中的一个子串。那么现在就来讲讲KMP。
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为KMP算法。KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息。时间复杂度O(m+n)。
设主串(下文中我们称作T)为:a b a c a a b a c a b a c a b a a b b
模式串(下文中我们称作W)为:a b a c a b
用暴力算法匹配字符串过程中,我们会把T[0] 跟 W[0] 匹配,如果相同则匹配下一个字符,直到出现不相同的情况,此时我们会丢弃前面的匹配信息,然后把T[1] 跟 W[0]匹配,循环进行,直到主串结束,或者出现匹配成功的情况。这种丢弃前面的匹配信息的方法,极大地降低了匹配效率。
而在KMP算法中,对于每一个模式串我们会事先计算出模式串的内部匹配信息,在匹配失败时最大的移动模式串,以减少匹配次数。
比如,在简单的一次匹配失败后,我们会想将模式串尽量的右移和主串进行匹配。右移的距离在KMP算法中是如此计算的:在已经匹配的模式串子串中,找出最长的相同的前缀和后缀,然后移动使它们重叠。
在第一次匹配过程中
T: a b a c a a b a c a b a c a b a a b b
W: a b a c ab
在T[5]与W[5]出现了不匹配,而T[0]T[4]是匹配的,现在T[0]T[4]就是上文中说的已经匹配的模式串子串,现在移动找出最长的相同的前缀和后缀并使他们重叠:
T: a b a c aab a c a b a c a b a a b b
W: a b a c ab
然后在从上次匹配失败的地方进行匹配,这样就减少了匹配次数,增加了效率。
然而,如果每次都要计算最长的相同的前缀反而会浪费时间,所以对于模式串来说,我们会提前计算出每个匹配失败的位置应该移动的距离,花费的时间就成了常数时间。
转移正题,明白了KMP算法之后,可以花在此题上面,于是就运行得飞快,初始化好了之后,直接带DG。
标程:
#include<cstdio>
#include<cstring>
char c,s[400007];
int l,i,j,ans,q[400007],f[400007];
int main()
{
while(scanf("%c",&c)!=EOF)
{
l++;
s[l]=c;
}
l--;
for(i=2;i<l;i++)
{
while(j>0&&s[j+1]!=s[i]) j=q[j];
if(s[j+1]==s[i]) q[i]=j+1;
j=q[i];
}
q[0]=-1;
while(j>-1)
{
if(s[j+1]==s[l])
{
ans++;
f[ans]=j+1;
}
j=q[j];
}
for(i=ans;i>=1;i--) printf("%d ",f[i]);
printf("%d\n",l);
}