●BZOJ 4566 [Haoi2016]找相同字符

题链:

http://www.lydsy.com/JudgeOnline/problem.php?id=4566

题解:

后缀数组,单调栈。
把两个串A,B拼接起来,中间用没出现过的字符隔开。
然后用倍增算法求出 sa[] rank[] height[]
接着用单调栈维护出两个数组 L[],R[],意义如下:
L[i]:表示在后缀数组中,排名最小(记其排名为 L[i])的后缀与排名为 i的后缀的LCP>=hei[i]
同理 R[i]:表示在后缀数组中,排名最大(记其排名为 R[i])的后缀与排名为 i的后缀的LCP>hei[i](注意这里没有'=',避免重复)
显然对于 i后缀而言,其左边[L[i],i-1]的任意后缀与其右边(包括自己)[i,R[i]]的任意后缀的 LCP==hei[i]
(如果记 ANS[i]:表示为两个串的长度为 i的公共子串的个数(最后的答案就是 ANS[1]+ANS[2]+ANS[3]+....+ANS[N]))
那么 ANS[i]+=左边的A串后缀的数量*右边的B串后缀的数量 + 左边的B串后缀的数量*右边的A串后缀的数量
至于怎么求出左边和右边分别有多少个 A,B的子串,用一个前缀和(或者后缀和)就好了。
   
但是还没有完,
以上贡献的值都是建立在 LCP(最长公共前缀)上的,
但还有 LCP-1,LCP-2,LCP-3......这些没有地方被贡献到,
所以就要最后反向遍历一下答案数组,用后面的去更新前面的,得到的才是正确的 ANS[]:
ANS[i]+=ANS[i+1];
   
然后把 ANS[]加起来就是最终答案了。

代码:

#include<cstdio>
#include<cstring>
#include<iostream>
#define MAXN 405000
#define filein(x) freopen(#x".in","r",stdin);
#define fileout(x) freopen(#x".out","w",stdout);
using namespace std;
char S[MAXN],A[MAXN],B[MAXN];
int	sa[MAXN],rak[MAXN],hei[MAXN];
int L[MAXN],R[MAXN],sufA[MAXN],sufB[MAXN];
long long ANS[MAXN];
void build(int N,int M){
	static int cc[MAXN],ta[MAXN],tb[MAXN],*x,*y,h,p;
	x=ta; y=tb; h=0;
	for(int i=0;i<M;i++) cc[i]=0;
	for(int i=0;i<N;i++) cc[x[i]=S[i]]++;
	for(int i=1;i<M;i++) cc[i]+=cc[i-1];
	for(int i=N-1;i>=0;i--) sa[--cc[x[i]]]=i;
	for(int k=1;p=0,k<N;k<<=1){
		for(int i=N-k;i<N;i++) y[p++]=i;
		for(int i=0;i<N;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
		for(int i=0;i<M;i++) cc[i]=0;
		for(int i=0;i<N;i++) cc[x[y[i]]]++;
		for(int i=1;i<M;i++) cc[i]+=cc[i-1];
		for(int i=N-1;i>=0;i--) sa[--cc[x[y[i]]]]=y[i];
		swap(x,y); y[N]=-1; x[sa[0]]=0; M=1;
		for(int i=1;i<N;i++)
			x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?M-1:M++;
		if(M>=N) break;
	}
	for(int i=0;i<N;i++) rak[sa[i]]=i/*,puts(S+sa[i])*/;
	for(int i=0,j;i<N;i++){
		if(h) h--;
		if(rak[i]){
			j=sa[rak[i]-1];
			while(S[i+h]==S[j+h]) h++;
		}
		hei[rak[i]]=h;
	}
}
void preLR(int N){
	static int stk[MAXN],stp[MAXN],top;
	stp[top=0]=0;
	for(int i=0;i<N;i++){
		while(top&&stk[top]>=hei[i]) top--;
		L[i]=stp[top]; top++;
		stk[top]=hei[i]; stp[top]=i;
	}
	stp[top=N]=N;
	for(int i=N-1;i>=0;i--){
		while(top<N&&stk[top]>hei[i]) top++;
		R[i]=stp[top]-1; top--;
		stk[top]=hei[i]; stp[top]=i;
	}
}
int main()
{
	int N=0,lA,lB; long long ans=0;
	scanf("%s",A); lA=strlen(A);
	scanf("%s",B); lB=strlen(B);
	for(int i=0;i<lA;i++) S[N+i]=A[i]; S[lA]='#'; N+=lA+1;
	for(int i=0;i<lB;i++) S[N+i]=B[i]; N+=lB;
	//puts(S); printf("%d",N);
	build(N,300);
	for(int i=N-1;i>=0;i--) sufA[i]=sufA[i+1]+(sa[i]<lA);
	for(int i=N-1;i>=0;i--) sufB[i]=sufB[i+1]+(sa[i]>lA);
	preLR(N);
	for(int i=0,l,r;i<N;i++){
		l=L[i]; r=R[i];
		ANS[hei[i]]+=1ll*(sufA[l]-sufA[i])*(sufB[i]-sufB[r+1]);
		ANS[hei[i]]+=1ll*(sufB[l]-sufB[i])*(sufA[i]-sufA[r+1]);
	}
	for(int i=N-1;i>=1;i--){
		ANS[i]+=ANS[i+1];
		ans+=ANS[i];
	}
	printf("%lld",ans);
	return 0;
}
posted @ 2017-12-09 17:48  *ZJ  阅读(125)  评论(0编辑  收藏  举报