POJ 3415 Common Substrings(后缀数组+单调栈)

 

【题目链接】 http://poj.org/problem?id=3415

 

【题目大意】

  求出两个字符串长度大于k的公共子串的数目。

 

【题解】

  首先,很容易想到O(n2)的算法,将A串和B串加拼接符相连,
  做一遍后缀数组,把分别属于A和B的所有后缀匹配,LCP-k+1就是对答案的贡献,
  但是在这个基础上该如何优化呢。
  我们可以发现按照sa的顺序下来,每个后缀和前面的串的LCP就是区间LCP的最小值,
  那么我们维护一个单调栈,将所有单调递减的LCP值合并,
  保存数量和长度,对每个属于B串的后缀更新前面A串的后缀的贡献,
  对属于A串的后缀更新属于B串的后缀的贡献即可。

 

【代码】

#include <cstdio>
#include <cstring>
#include <algorithm> 
using namespace std;
typedef long long ll;
const int N=400010;
int n,rank[N],sa[N],h[N],tmp[N],cnt[N];char s[N];
void suffixarray(int n,int m){
    int i,j,k;n++;
    for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
    for(i=0;i<m;i++)cnt[i]=0;
    for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
    for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
    for(k=1;k<=n;k<<=1){
        for(i=0;i<n;i++){
            j=sa[i]-k;
            if(j<0)j+=n;
            tmp[cnt[rank[j]]++]=j;
        }sa[tmp[cnt[0]=0]]=j=0;
        for(i=1;i<n;i++){
            if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
            sa[tmp[i]]=j;
        }memcpy(rank,sa,n*sizeof(int));
        memcpy(sa,tmp,n*sizeof(int));
        if(j>=n-1)break;
    }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
}
int na[N],nb[N],K,st[N],top;
int main(){
    while(~scanf("%d",&K),K){
        scanf(" %s",s);
        int len=strlen(s); s[len]='#';
        scanf(" %s",s+len+1);
        n=strlen(s);
        suffixarray(n,128);
        for(int i=2;i<=n;i++)h[i]=max(0,h[i]-K+1);
        ll ans=0,w1=0,w2=0; top=0;
        for(int i=2;i<=n;i++){
            st[++top]=h[i];
            if(sa[i-1]<len)na[top]=1,nb[top]=0,w1+=h[i];
            else na[top]=0,nb[top]=1,w2+=h[i];
            while((top>1)&&st[top]<=st[top-1]){
                w1-=na[top-1]*(st[top-1]-st[top]);
                w2-=nb[top-1]*(st[top-1]-st[top]);
                na[top-1]+=na[top]; nb[top-1]+=nb[top];
                st[top-1]=st[top--];
            }if(sa[i]<len)ans+=w2;
            else ans+=w1;
        }printf("%lld\n",ans);
    }return 0;
}

  

posted @ 2016-11-15 22:59  forever97  阅读(312)  评论(0编辑  收藏  举报