BZOJ3670: [Noi2014]动物园
Description
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”
园长:“非常好!那你能举个例子吗?”
熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。
下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?
特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出对1,000,000,007取模的结果即可。
Input
第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
Output
包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。
Sample Input
3
aaaaa
ab
abcababc
Sample Output
36
1
32
HINT
n≤5,L≤1,000,000
Solution
这题对kmp的next的数组解释的很好哇qwq
其实题目求的是对于每个前缀,它共有多少个不重合的next可以满足它,而不是最长的不重合的next。
所以我们有一个很直观的想法,跑一遍kmp,处理出next数组。
然后暴力向前跳next直至不会重合,即\(next[j]<i/2\),然后往前面继续找一共有多少个不为0的next(事实上能跳到的next都有公共的前后缀)
这样有50分,是最暴力的做法,效率最坏被卡到\(O(Tn^2)\)。
然后考虑优化一下,next数组的本质是一棵树,所以我们其实可以利用一下倍增。
倍增跳next数组的复杂度是\(O(Tnlogn)\)
可以通过把log的那一位放到前面(这是一种卡常技巧),然后再开个O2就能过了。
正解是\(O(n)\)的。
我们暴力跳看起来很傻,因为可以通过递推一次求出每个next能够往前跳到的next的个数,这样我们之前第二次往前跳就能\(O(1)\)处理了。
然后第一次的往前跳,我们可以这么优化,那个j我们并不去重置它,在上次找完的基础上继续类比kmp用模式串匹配文本串的那种方式去找,这样是均摊\(O(1)\)的
然后如果不满足情况的(即\(next[i]>i/2\)),我们直接暴力跳即可,但是实际上这样要跳的次数是很少的(应该基本只有一两次,实测很快)。
所以总的复杂度是\(O(n)\)的
暴力
#include <bits/stdc++.h>
using namespace std;
#define N 1000100
#define ll long long
#define mod 1000000007
int T, nxt[N], sum[N];
char s[N];
ll ans = 0;
int main() {
scanf("%d", &T);
while(T--) {
ans = 1;
scanf("%s", s + 1);
int n = strlen(s + 1);
memset(nxt, 0, sizeof(nxt));
for(int i = 2, j = 0; i <= n; ++i) {
while(j && s[j + 1] != s[i]) j = nxt[j];
if(s[j + 1] == s[i]) ++j;
nxt[i] = j;
}
for(int i = 1; i <= n; ++i) {
int t = i;
while(nxt[t] && nxt[t] > i / 2) t = nxt[t];
while(nxt[t]) t = nxt[t], ++sum[i];
++sum[i];
ans = ans * sum[i] % mod;
sum[i] = 0;
}
printf("%lld\n", ans % mod);
}
}
倍增
#include <bits/stdc++.h>
using namespace std;
#define N 1000100
#define ll long long
#define mod 1000000007
int T, nxt[N], f[20][N];
char s[N];
int ans = 0;
int main() {
scanf("%d", &T);
while(T--) {
ans = 1;
scanf("%s", s + 1);
int n = strlen(s + 1);
nxt[1] = 0;
for(int i = 2, j = 0; i <= n; ++i) {
while(j && s[j + 1] != s[i]) j = nxt[j];
if(s[j + 1] == s[i]) ++j;
nxt[i] = j;
f[0][i] = nxt[i];
}
for(int k = 1; k < 20; ++k) {
for(int i = 1; i <= n; ++i) {
f[k][i] = f[k - 1][f[k - 1][i]];
}
}
for(int i = 2; i <= n; ++i) {
int t = i, sum = 0;
for(int j = 19; j >= 0; --j)
if(f[j][t] > i / 2) t = f[j][t];
for(int j = 19; j >= 0; --j)
if(f[j][t]) sum += (1 << j), t = f[j][t];
ans = 1ll * ans * (sum + 1) % mod;
}
printf("%d\n", ans);
}
}
正解
#include <bits/stdc++.h>
using namespace std;
#define N 1000100
#define ll long long
#define mod 1000000007
int T, nxt[N], num[N];
char s[N];
ll ans = 0;
int main() {
scanf("%d", &T);
while(T--) {
ans = 1;
scanf("%s", s + 1);
int n = strlen(s + 1);
num[1] = 1;
for(int i = 2, j = 0; i <= n; ++i) {
while(j && s[j + 1] != s[i]) j = nxt[j];
if(s[j + 1] == s[i]) ++j;
nxt[i] = j;
num[i] = num[nxt[i]] + 1;
}
for(int i = 2, j = 0; i <= n; ++i) {
while(j && s[j + 1] != s[i]) j = nxt[j];
if(s[j + 1] == s[i]) ++j;
while(j * 2 > i) j = nxt[j];
ans = 1ll * ans * (num[j] + 1) % mod;
}
printf("%lld\n", ans);
}
}