【CodeForces】961 F. k-substrings 字符串哈希+二分
【题目】F. k-substrings
【题意】给定长度为n的串S,对于S的每个k-子串$s_ks_{k+1}...s_{n-k+1},k\in[1,\left \lceil \frac{n}{2} \right \rceil]$,找到满足[奇数长度][严格子串][同时是前缀和后缀]的最长子串。n<=10^6。
【算法】字符串哈希+二分
【题解】任意两个对应子串,它们有一个不变量——它们的中心一定是i和n-i+1。而且固定中心之后,能延伸的最长相等子串是可以二分+哈希得到的。
所以枚举k,二分+哈希处理出以k为中心和对应串相等的最长子串半长L。
然后实际上是一个递减序列覆盖求单点最值的问题,有一个巧妙的解决方法,在k-L+1处标记答案,然后从前往后扫描每次和ans[i]=max{ans[i],ans[i-1]-2}。因为这是一个从大到小的递减序列,所以就不需要考虑终止,因为<0就自然没有意义了。
复杂度O(n log n)。
#include<cstdio> #include<cstring> #include<algorithm> using namespace std; const int maxn=1000010; int ans[maxn],n; char s[maxn]; int a[maxn],b[maxn],c[maxn],d[maxn]; const int MOD1=993258975,MOD2=934384734,base1=233,base2=197; bool check(int l,int r,int L,int R){ int x=r-l+1;// int ans1=(a[r]-1ll*a[l-1]*c[x]%MOD1+MOD1)%MOD1; int ans2=(a[R]-1ll*a[L-1]*c[x]%MOD1+MOD1)%MOD1; if(ans1!=ans2)return 0; ans1=(b[r]-1ll*b[l-1]*d[x]%MOD2+MOD2)%MOD2; ans2=(b[R]-1ll*b[L-1]*d[x]%MOD2+MOD2)%MOD2; if(ans1!=ans2)return 0; return 1; } int main(){ scanf("%d%s",&n,s+1);c[0]=d[0]=1; for(int i=1;i<=n;i++)a[i]=(1ll*a[i-1]*base1+s[i])%MOD1,b[i]=(1ll*b[i-1]*base2+s[i])%MOD2; for(int i=1;i<=n;i++)c[i]=1ll*c[i-1]*base1%MOD1,d[i]=1ll*d[i-1]*base2%MOD2; memset(ans,-1,sizeof(ans)); for(int i=1;i<=n/2;i++){ int l=1,r=i+1,mid; while(l<r){ mid=(l+r)>>1; if(check(i-mid+1,i+mid-1,n-i+1-mid+1,n-i+1+mid-1))l=mid+1;else r=mid; } l--; ans[i-l+1]=max(ans[i-l+1],2*l-1); } for(int i=1;i<=n/2;i++){ ans[i]=max(ans[i],ans[i-1]-2); printf("%d ",ans[i]); } if(n&1)printf("-1"); return 0; }
字符串哈希:将字符串换算成base进制的数字取模接近int的素模数,比较两段字符串时判断a[r]-a[l-1]*base^(r-l+1)是否相等即可。当然需要双哈希。
如果是建哈希表,就建一条链存真实值。(参考插头DP)
顺便提一下朴素KMP处理一次询问的方法:整个字符串跑出fail数组,那么从n一直fail到最小的>0的位置就是最小首尾匹配串了。KMP的fail树十分强大。