[NOI2016]优秀的拆分
XXI.[NOI2016]优秀的拆分
这后缀数组越来越像一个用来求\(\operatorname{LCP}\)的工具人了……
对于一个\(\text{AABB}\)的拆分,我们可以在中间切一刀,变成\(\text{AA}\)与\(\text{BB}\)两半。这时,我们只需要设\(a_i\)表示以\(i\)为结尾的\(\text{AA}\)串数量,\(b_i\)表示以\(i\)开头的\(\text{BB}\)串数量,则答案即为\(\sum a_ib_{i+1}\)。
显然,这个可以通过hash做到\(n^2\),并且可以取得\(95\%\)的好成绩,毫无区分意义。
然后就是一个非常神仙的思路了:
我们枚举一个长度\(len\),然后每隔\(len\)个字符设立一个关键点。则任何长度\(\geq2len\)的子串都经过且只经过两个关键点。则我们枚举每一对相邻的关键点,并尝试求出有多少个合法子串经过了它。
我们求出这两个关键点的\(\operatorname{LCP}\)与\(\operatorname{LCS(Longest Common Suffix)}\),这可以直接使用后缀数组+ST表求出。如果它们的和\(\geq len\),则显然就有合法的串经过它们,这一数量为\(\operatorname{LCP}+\operatorname{LCS}-len+1\)个。我们只需要差分就可以得到\(a\)与\(b\)数组。
因为\(\sum\limits_{i=1}^n\dfrac{n}{i}=n\log n\),所以该算法复杂度即为\(O(n\log n)\)。
记得清空所有数组!!!
代码:
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=30100;
int T,n,a[N],b[N];
ll res;
char str[N];
struct Suffix_Array{
int x[N],y[N],buc[N],sa[N],ht[N],rk[N],LG[N],mn[N][16],m;
char s[N];
void init(){
for(int i=0;i<N;i++)x[i]=y[i]=buc[i]=sa[i]=ht[i]=rk[i]=LG[i]=0;
memset(mn,0,sizeof(mn));
m='z';
}
bool mat(int a,int b,int k){
if(y[a]!=y[b])return false;
if((a+k<n)^(b+k<n))return false;
if((a+k<n)&&(b+k<n))return y[a+k]==y[b+k];
return true;
}
void SA(){
for(int i=0;i<n;i++)buc[x[i]=s[i]]++;
for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
for(int i=n-1;i>=0;i--)sa[--buc[x[i]]]=i;
for(int k=1;k<n;k<<=1){
int num=0;
for(int i=n-k;i<n;i++)y[num++]=i;
for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
for(int i=0;i<=m;i++)buc[i]=0;
for(int i=0;i<n;i++)buc[x[y[i]]]++;
for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
for(int i=n-1;i>=0;i--)sa[--buc[x[y[i]]]]=y[i];
swap(x,y);
x[sa[0]]=num=0;
for(int i=1;i<n;i++)x[sa[i]]=mat(sa[i],sa[i-1],k)?num:++num;
if(num>=n-1)break;
m=num;
}
for(int i=0;i<n;i++)rk[sa[i]]=i;
for(int i=0,k=0;i<n;i++){
if(!rk[i])continue;
if(k)k--;
int j=sa[rk[i]-1];
while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
ht[rk[i]]=k;
}
for(int i=2;i<n;i++)LG[i]=LG[i>>1]+1;
for(int i=1;i<n;i++)mn[i][0]=ht[i];
for(int j=1;j<=LG[n-1];j++)for(int i=1;i+(1<<j)-1<n;i++)mn[i][j]=min(mn[i][j-1],mn[i+(1<<(j-1))][j-1]);
}
int RMQ(int l,int r){
if(l>=n||r>=n||l<0||r<0)return 0;
l=rk[l],r=rk[r];
if(l>r)swap(l,r);
l++;
int k=LG[r-l+1];
return min(mn[l][k],mn[r-(1<<k)+1][k]);
}
}pre,suf;
int main(){
scanf("%d",&T);
while(T--){
scanf("%s",str),n=strlen(str),memset(a,0,sizeof(a)),memset(b,0,sizeof(b)),res=0;
pre.init(),suf.init();
memcpy(pre.s,str,sizeof(str)),memcpy(suf.s,str,sizeof(str)),reverse(pre.s,pre.s+n);
// printf("%s\n%s\n",pre.s,suf.s);
pre.SA(),suf.SA();
// for(int i=0;i<n;i++)printf("%d ",pre.rk[i]);puts("");
// for(int i=0;i<n;i++)printf("%d ",suf.rk[i]);puts("");
for(int len=1;len<=n/2;len++)for(int i=0;i+len<n;i+=len){
int p=i,q=i+len,r=n-q,s=n-p;
int LCP=min(suf.RMQ(p,q),len);
int LCS=min(pre.RMQ(r,s),len-1);
int Delta=LCP+LCS-len+1;
if(Delta>=0)b[p-LCS]++,b[p-LCS+Delta]--,a[q+LCP-Delta]++,a[q+LCP]--;
}
// for(int i=0;i<n;i++)printf("(%d %d)\n",a[i],b[i]);
for(int i=1;i<n;i++)a[i]+=a[i-1],b[i]+=b[i-1];
for(int i=1;i<n;i++)res+=a[i-1]*b[i];
printf("%lld\n",res);
}
return 0;
}