bzoj3670: [Noi2014]动物园
http://www.lydsy.com/JudgeOnline/problem.php?id=3670
法一:KMP+st表
抽离nxt数组,构成一棵树
若nxt[i]=j,则i作为j的子节点
那么num[i] 就是i到根节点的路径上,所有<=i/2 的节点的个数
这棵树的点随深度的递增而增大
所以用st表存这棵树
st 表 开[logn][n],常数优化求st表的过程
#include<cmath> #include<cstdio> #include<cstring> #define N 1000001 using namespace std; const int mod=1e9+7; char s[N]; int len; int f[N]; int dep[N],st[21][N]; int num[N]; void get_next() { int j; for(int i=1;i<len;++i) { j=f[i]; while(j && s[i]!=s[j]) j=f[j]; f[i+1]= s[j]==s[i] ? j+1 : 0; } } void solve() { for(int i=1;i<=len;++i) st[0][i]=f[i],dep[i]=dep[f[i]]+1; int lim=1.0*log(len)/log(2); for(int j=1;j<=lim;++j) for(int i=1;i<=len;++i) st[j][i]=st[j-1][st[j-1][i]]; int now; for(int i=1;i<=len;++i) { now=i; for(int j=lim;j>=0;--j) if(st[j][now]*2>i) now=st[j][now]; num[i]=dep[now]-1; } int ans=1; for(int i=1;i<=len;++i) ans=1LL*ans*(num[i]+1)%mod; printf("%d\n",ans); } int main() { //freopen("data.in","r",stdin); //freopen("my.out","w",stdout); int T; scanf("%d",&T); while(T--) { scanf("%s",s); len=strlen(s); get_next(); solve(); } }
法二:kmp 变形
求一个数组cnt[i] ,前i个字符构成的字符串中,既是它的后缀同时又是它的前缀 的子串个数
即原题中的num[i] 去掉不能重叠的限制
那么num[i] 就是k从nxt[i]往前跳,跳到的第一个满足k*2<=i 的cnt[k]
#include<cstdio> #include<cstring> using namespace std; #define N 1000001 const int mod=1e9+7; char s[N]; int len; int f[N],cnt[N]; void getnxt() { int ans=1; len=strlen(s+1); cnt[1]=1; int j=0,k; for(int i=2;i<=len;++i) { while(j && s[i]!=s[j+1]) j=f[j]; if(s[j+1]==s[i]) j++; f[i]=j; cnt[i]=cnt[j]+1; } } void solve() { int ans=1; int k=0; for(int i=2;i<=len;++i) { while(k && s[k+1]!=s[i]) k=f[k]; if(s[k+1]==s[i]) k++; while(k*2>i) k=f[k]; ans=1LL*ans*(cnt[k]+1)%mod; } printf("%d\n",ans); } int main() { // freopen("zoo.in","r",stdin); // freopen("zoo.out","w",stdout); int T; scanf("%d",&T); while(T--) { scanf("%s",s+1); getnxt(); solve(); } }
法三:哈希+二分+差分
(本思路来自myj,ORZZZZZZ)
对于每一个i,求一个以i为后缀左端点,满足既是后缀又是前缀的 最大的后缀(前缀)长度
设其为t,这可以哈希+二分求
那么num[i]~num[i+t-1] 都会有一个贡献
差分,求前缀和即可得num数组
#include <cstdio> #include <cstring> #include <iostream> #include <algorithm> typedef unsigned long long ll; const int mod1=29; const int mod2=37; const int mod=1e9+7; const int maxn=1e6+5; int T,n,num[maxn]; ll Hash1[maxn],Hash2[maxn],hpos1[maxn],hpos2[maxn]; char str[maxn]; inline int getlen(int x) { int l=1,r=std::min(n-x+1,(x-1)*2-x+1),mid,res=0; while(l<=r) { mid=l+r>>1; if(Hash1[mid]==(Hash1[x+mid-1]-Hash1[x-1]*hpos1[mid]) &&Hash2[mid]==(Hash2[x+mid-1]-Hash2[x-1]*hpos2[mid])) { res=mid; l=mid+1; } else r=mid-1; } return res; } int main() { hpos1[0]=hpos2[0]=1; for(int i=1;i<maxn;i++) { hpos1[i]=hpos1[i-1]*mod1; hpos2[i]=hpos2[i-1]*mod2; } std::cin>>T; while(T--) { scanf("%s",str+1); n=strlen(str+1); num[0]=0; for(int i=1;i<=n;i++) { num[i]=0; Hash1[i]=Hash1[i-1]*mod1+str[i]-'a'+1; Hash2[i]=Hash2[i-1]*mod2+str[i]-'a'+1; } for(int i=2,t;i<=n;i++) { t=getlen(i); num[i]++; num[i+t]--; } ll res=1,now=1; for(int i=1;i<=n;i++) (res*=(now+=num[i]))%=mod; std::cout<<res<<std::endl; } return 0; }
3670: [Noi2014]动物园
Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 3320 Solved: 1798
[Submit][Status][Discuss]
Description
近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。
某天,园长给动物们讲解KMP算法。
园长:“对于一个字符串S,它的长度为L。我们可以在O(L)的时间内,求出一个名为next的数组。有谁预习了next数组的含义吗?”
熊猫:“对于字符串S的前i个字符构成的子串,既是它的后缀又是它的前缀的字符串中(它本身除外),最长的长度记作next[i]。”
园长:“非常好!那你能举个例子吗?”
熊猫:“例S为abcababc,则next[5]=2。因为S的前5个字符为abcab,ab既是它的后缀又是它的前缀,并且找不到一个更长的字符串满足这个性质。同理,还可得出next[1] = next[2] = next[3] = 0,next[4] = next[6] = 1,next[7] = 2,next[8] = 3。”
园长表扬了认真预习的熊猫同学。随后,他详细讲解了如何在O(L)的时间内求出next数组。
下课前,园长提出了一个问题:“KMP算法只能求出next数组。我现在希望求出一个更强大num数组一一对于字符串S的前i个字符构成的子串,既是它的后缀同时又是它的前缀,并且该后缀与该前缀不重叠,将这种字符串的数量记作num[i]。例如S为aaaaa,则num[4] = 2。这是因为S的前4个字符为aaaa,其中a和aa都满足性质‘既是后缀又是前缀’,同时保证这个后缀与这个前缀不重叠。而aaa虽然满足性质‘既是后缀又是前缀’,但遗憾的是这个后缀与这个前缀重叠了,所以不能计算在内。同理,num[1] = 0,num[2] = num[3] = 1,num[5] = 2。”
最后,园长给出了奖励条件,第一个做对的同学奖励巧克力一盒。听了这句话,睡了一节课的企鹅立刻就醒过来了!但企鹅并不会做这道题,于是向参观动物园的你寻求帮助。你能否帮助企鹅写一个程序求出num数组呢?
特别地,为了避免大量的输出,你不需要输出num[i]分别是多少,你只需要输出对1,000,000,007取模的结果即可。
Input
第1行仅包含一个正整数n ,表示测试数据的组数。随后n行,每行描述一组测试数据。每组测试数据仅含有一个字符串S,S的定义详见题目描述。数据保证S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。
Output
包含 n 行,每行描述一组测试数据的答案,答案的顺序应与输入数据的顺序保持一致。对于每组测试数据,仅需要输出一个整数,表示这组测试数据的答案对 1,000,000,007 取模的结果。输出文件中不应包含多余的空行。
Sample Input
aaaaa
ab
abcababc
Sample Output
1
32
HINT
n≤5,L≤1,000,000