[NOI2016]优秀的拆分

XXI.[NOI2016]优秀的拆分

这后缀数组越来越像一个用来求\(\operatorname{LCP}\)的工具人了……

对于一个\(\text{AABB}\)的拆分,我们可以在中间切一刀,变成\(\text{AA}\)\(\text{BB}\)两半。这时,我们只需要设\(a_i\)表示以\(i\)为结尾的\(\text{AA}\)串数量,\(b_i\)表示以\(i\)开头的\(\text{BB}\)串数量,则答案即为\(\sum a_ib_{i+1}\)

显然,这个可以通过hash做到\(n^2\),并且可以取得\(95\%\)的好成绩,毫无区分意义

然后就是一个非常神仙的思路了:

我们枚举一个长度\(len\),然后每隔\(len\)个字符设立一个关键点。则任何长度\(\geq2len\)的子串都经过且只经过两个关键点。则我们枚举每一对相邻的关键点,并尝试求出有多少个合法子串经过了它。

我们求出这两个关键点的\(\operatorname{LCP}\)\(\operatorname{LCS(Longest Common Suffix)}\),这可以直接使用后缀数组+ST表求出。如果它们的和\(\geq len\),则显然就有合法的串经过它们,这一数量为\(\operatorname{LCP}+\operatorname{LCS}-len+1\)个。我们只需要差分就可以得到\(a\)\(b\)数组。

因为\(\sum\limits_{i=1}^n\dfrac{n}{i}=n\log n\),所以该算法复杂度即为\(O(n\log n)\)

记得清空所有数组!!!

代码:

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=30100;
int T,n,a[N],b[N];
ll res;
char str[N];
struct Suffix_Array{
	int x[N],y[N],buc[N],sa[N],ht[N],rk[N],LG[N],mn[N][16],m;
	char s[N];
	void init(){
		for(int i=0;i<N;i++)x[i]=y[i]=buc[i]=sa[i]=ht[i]=rk[i]=LG[i]=0;
		memset(mn,0,sizeof(mn));
		m='z';
	}
	bool mat(int a,int b,int k){
		if(y[a]!=y[b])return false;
		if((a+k<n)^(b+k<n))return false;
		if((a+k<n)&&(b+k<n))return y[a+k]==y[b+k];
		return true;
	}
	void SA(){
		for(int i=0;i<n;i++)buc[x[i]=s[i]]++;
		for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
		for(int i=n-1;i>=0;i--)sa[--buc[x[i]]]=i;
		for(int k=1;k<n;k<<=1){
			int num=0;
			for(int i=n-k;i<n;i++)y[num++]=i;
			for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
			for(int i=0;i<=m;i++)buc[i]=0;
			for(int i=0;i<n;i++)buc[x[y[i]]]++;
			for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
			for(int i=n-1;i>=0;i--)sa[--buc[x[y[i]]]]=y[i];
			swap(x,y);
			x[sa[0]]=num=0;
			for(int i=1;i<n;i++)x[sa[i]]=mat(sa[i],sa[i-1],k)?num:++num;
			if(num>=n-1)break;
			m=num;
		}
		for(int i=0;i<n;i++)rk[sa[i]]=i;
		for(int i=0,k=0;i<n;i++){
			if(!rk[i])continue;
			if(k)k--;
			int j=sa[rk[i]-1];
			while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
			ht[rk[i]]=k;
		}
		for(int i=2;i<n;i++)LG[i]=LG[i>>1]+1;
		for(int i=1;i<n;i++)mn[i][0]=ht[i];
		for(int j=1;j<=LG[n-1];j++)for(int i=1;i+(1<<j)-1<n;i++)mn[i][j]=min(mn[i][j-1],mn[i+(1<<(j-1))][j-1]);
	}
	int RMQ(int l,int r){
		if(l>=n||r>=n||l<0||r<0)return 0;
		l=rk[l],r=rk[r];
		if(l>r)swap(l,r);
		l++;
		int k=LG[r-l+1];
		return min(mn[l][k],mn[r-(1<<k)+1][k]);
	}
}pre,suf;
int main(){
	scanf("%d",&T);
	while(T--){
		scanf("%s",str),n=strlen(str),memset(a,0,sizeof(a)),memset(b,0,sizeof(b)),res=0;
		pre.init(),suf.init();
		memcpy(pre.s,str,sizeof(str)),memcpy(suf.s,str,sizeof(str)),reverse(pre.s,pre.s+n);
//		printf("%s\n%s\n",pre.s,suf.s);
		pre.SA(),suf.SA();
//		for(int i=0;i<n;i++)printf("%d ",pre.rk[i]);puts("");
//		for(int i=0;i<n;i++)printf("%d ",suf.rk[i]);puts("");
		for(int len=1;len<=n/2;len++)for(int i=0;i+len<n;i+=len){
			int p=i,q=i+len,r=n-q,s=n-p;
			int LCP=min(suf.RMQ(p,q),len);
			int LCS=min(pre.RMQ(r,s),len-1);
			int Delta=LCP+LCS-len+1;
			if(Delta>=0)b[p-LCS]++,b[p-LCS+Delta]--,a[q+LCP-Delta]++,a[q+LCP]--;
		}
//		for(int i=0;i<n;i++)printf("(%d %d)\n",a[i],b[i]);
		for(int i=1;i<n;i++)a[i]+=a[i-1],b[i]+=b[i-1];
		for(int i=1;i<n;i++)res+=a[i-1]*b[i];
		printf("%lld\n",res);
	}
	return 0;
}

posted @ 2021-04-01 10:55  Troverld  阅读(82)  评论(0编辑  收藏  举报