[HAOI2016]找相同字符

VII.[HAOI2016]找相同字符

第一道自己做出的SA题祭~~~

实际上和上一题没啥区别的说……

我们发现,这题实际上就是对于两个串中所有的后缀求\(\operatorname{LCP}\)之和(因为这两个后缀共有\(\operatorname{LCP}\)个前缀是相同的,即串中有这么多子串是相同的)。

老套路,俩串中间插个字符怼一起,求个\(ht\)数组。记录个前缀和,\(s1_i\)表示前\(i\)个字符有多少个来自串一,\(s2_i\)表示前\(i\)个字符有多少来自串二,然后仍然跑单调栈,算出所有来自不同串的后缀对数量,乘上\(ht\)求和即可。

关键代码:

for(int i=1;i<n;i++)res+=(1ll*(s1[i-1]-s1[L[i]-1])*(s2[R[i]-1]-s2[i-1])+1ll*(s2[i-1]-s2[L[i]-1])*(s1[R[i]-1]-s1[i-1]))*ht[i];

复杂度\(O(n)\),假如你用DC3的话。

代码:

#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
int n,m,p;
int x[400100],y[400100],sa[400100],ht[400100],rk[400100],buc[400100];
int stk[400100],tp,L[400100],R[400100];
int s1[400100],s2[400100];
char s[400100];
ll res;
bool mat(int a,int b,int k){
	if(y[a]!=y[b])return false;
	if((a+k<n)^(b+k<n))return false;
	if((a+k<n)&&(b+k<n))return y[a+k]==y[b+k];
	return true;
}
void SA(){
	for(int i=0;i<n;i++)buc[x[i]=s[i]]++;
	for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
	for(int i=n-1;i>=0;i--)sa[--buc[x[i]]]=i;
	for(int k=1;k<n;k<<=1){
		int num=0;
		for(int i=n-k;i<n;i++)y[num++]=i;
		for(int i=0;i<n;i++)if(sa[i]>=k)y[num++]=sa[i]-k;
		for(int i=0;i<=m;i++)buc[i]=0;
		for(int i=0;i<n;i++)buc[x[y[i]]]++;
		for(int i=1;i<=m;i++)buc[i]+=buc[i-1];
		for(int i=n-1;i>=0;i--)sa[--buc[x[y[i]]]]=y[i],y[i]=0;
		swap(x,y);
		x[sa[0]]=num=0;
		for(int i=1;i<n;i++)x[sa[i]]=mat(sa[i],sa[i-1],k)?num:++num;
		m=num;
	}
	for(int i=0;i<n;i++)rk[sa[i]]=i;
	for(int i=0,k=0;i<n;i++){
		if(!rk[i])continue;
		if(k)k--;
		int j=sa[rk[i]-1];
		while(i+k<n&&j+k<n&&s[i+k]==s[j+k])k++;
		ht[rk[i]]=k;
	}
}
int main(){
	scanf("%s",s),p=strlen(s),s[p]=' ',scanf("%s",s+p+1),n=strlen(s),m='z';
//	printf("%s\n",s);
	SA();
	for(int i=1;i<n;i++)s1[i]=s1[i-1]+(sa[i]<p),s2[i]=s2[i-1]+(sa[i]>p);
//	for(int i=0;i<n;i++)printf("%d ",sa[i]);puts("");
//	for(int i=0;i<n;i++)printf("(%d,%d)",s1[i],s2[i]);puts("");
	for(int i=1;i<n;i++){
		while(tp&&ht[stk[tp]]>=ht[i])R[stk[tp--]]=i;
		L[i]=stk[tp],stk[++tp]=i;
	}
//	for(int i=0;i<n;i++)printf("%d ",rk[i]);puts("");
	while(tp)R[stk[tp--]]=n;
//	for(int i=1;i<n;i++)printf("%d:(%d,%d):%d\n",i,L[i],R[i],ht[i]);
	for(int i=1;i<n;i++)res+=(1ll*(s1[i-1]-s1[L[i]-1])*(s2[R[i]-1]-s2[i-1])+1ll*(s2[i-1]-s2[L[i]-1])*(s1[R[i]-1]-s1[i-1]))*ht[i];
	printf("%lld\n",res);
	return 0;
}

posted @ 2021-03-31 16:57  Troverld  阅读(60)  评论(0编辑  收藏  举报