POJ 3415 Common Substrings(后缀数组+单调栈)
【题目链接】 http://poj.org/problem?id=3415
【题目大意】
求出两个字符串长度大于k的公共子串的数目。
【题解】
首先,很容易想到O(n2)的算法,将A串和B串加拼接符相连,
做一遍后缀数组,把分别属于A和B的所有后缀匹配,LCP-k+1就是对答案的贡献,
但是在这个基础上该如何优化呢。
我们可以发现按照sa的顺序下来,每个后缀和前面的串的LCP就是区间LCP的最小值,
那么我们维护一个单调栈,将所有单调递减的LCP值合并,
保存数量和长度,对每个属于B串的后缀更新前面A串的后缀的贡献,
对属于A串的后缀更新属于B串的后缀的贡献即可。
【代码】
#include <cstdio> #include <cstring> #include <algorithm> using namespace std; typedef long long ll; const int N=400010; int n,rank[N],sa[N],h[N],tmp[N],cnt[N];char s[N]; void suffixarray(int n,int m){ int i,j,k;n++; for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0; for(i=0;i<m;i++)cnt[i]=0; for(i=0;i<n;i++)cnt[rank[i]=s[i]]++; for(i=1;i<m;i++)cnt[i]+=cnt[i-1]; for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i; for(k=1;k<=n;k<<=1){ for(i=0;i<n;i++){ j=sa[i]-k; if(j<0)j+=n; tmp[cnt[rank[j]]++]=j; }sa[tmp[cnt[0]=0]]=j=0; for(i=1;i<n;i++){ if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i; sa[tmp[i]]=j; }memcpy(rank,sa,n*sizeof(int)); memcpy(sa,tmp,n*sizeof(int)); if(j>=n-1)break; }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++) while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1]; } int na[N],nb[N],K,st[N],top; int main(){ while(~scanf("%d",&K),K){ scanf(" %s",s); int len=strlen(s); s[len]='#'; scanf(" %s",s+len+1); n=strlen(s); suffixarray(n,128); for(int i=2;i<=n;i++)h[i]=max(0,h[i]-K+1); ll ans=0,w1=0,w2=0; top=0; for(int i=2;i<=n;i++){ st[++top]=h[i]; if(sa[i-1]<len)na[top]=1,nb[top]=0,w1+=h[i]; else na[top]=0,nb[top]=1,w2+=h[i]; while((top>1)&&st[top]<=st[top-1]){ w1-=na[top-1]*(st[top-1]-st[top]); w2-=nb[top-1]*(st[top-1]-st[top]); na[top-1]+=na[top]; nb[top-1]+=nb[top]; st[top-1]=st[top--]; }if(sa[i]<len)ans+=w2; else ans+=w1; }printf("%lld\n",ans); }return 0; }
愿你出走半生,归来仍是少年