[KMP][BZOJ1355][Baltic2009]Radio Transmission
题面
Description
给你一个字符串,它是由某个字符串不断自我连接形成的。 但是这个字符串是不确定的,现在只想知道它的最短长度是多少。
Input
第一行给出字符串的长度,\(1 < L \le 1,000,000\). 第二行给出一个字符串,全由小写字母组成。
Output
输出最短的长度。
SampleInput
8
cabcabca
SampleOutput
3
Hint
对于样例,我们可以利用"abc"不断自我连接得到"abcabcabc",读入的cabcabca,是它的子串。
首先让我们来研究一下结果的含义。
不妨设结果为串\(T\)。 则原串为:
我们怎样利用起KMP中的nxt数组呢?
由于\(T\)串是最小循环子串,所以可以标出KMP中\(nxt[n]\)(n为\(|A|\))为:
结果为n-nxt[n]!但是为什么呢?
如果T不是最小循环子串的话,nxt[n]必定还可以再加长。
否则,\(nxt[n]\)若再往左边扩展,不妨设增长的为\(T2\),剩下的\(T1\),分两种情况讨论。
1.\(|T1|>=|T2|\)
将两个串对齐可得:
若两串匹配,则显然可得\(T2\)是\(T1\)的前缀,即\(T1=T2+R\),且\(R\)也是\(T1\)的前缀,余下的为\(T2\),即\(T1=R+T2\),则显然\(T1\)是比\(T\)更小的循环子串,与前设矛盾,
故两串必定不匹配。
2.\(|T1|<|T2|\)
将两个串对齐可得:
同理。
若两串匹配,则显然可得\(T1\)是\(T2\)的前缀,即\(T2=T1+R\),且\(R\)也是\(T2\)的前缀,余下的为\(T1\),即\(T2=R+T1\),则显然\(T2\)是比\(T\)更小的循环子串,与前设矛盾,
故两串必定不匹配。
这样一来,我们就证明了答案为\(n-nxt[n]\)!
然后就可以直接套KMP模板了。
#include<iostream>
#include<cstring>
#include<cstdio>
using namespace std;
int nxt[1000001],n;
char a[1000001];
int main(){
scanf("%d%s",&n,a);
int k=0;
for(int i=2;i<=n;i++){
while(k&&a[k]!=a[i-1])k=nxt[k];
if(a[k]==a[i-1])k++;
nxt[i]=k;
}
printf("%d\n",n-nxt[n]);
}