POJ3415:Common Substrings——题解

http://poj.org/problem?id=3415

给定两个字符串A 和B,求长度不小于k 的公共子串的个数(可以相同)。

论文题,和上道题(POJ2774)类似,首先想到现将AB串合并,然后子串可以表示成字符串后缀的前缀,于是我们比较任意两个A后缀和B后缀,用height求出他们的公共子串长度就很好做了。

(不懂为什么好做的可以看SPOJ694

那么最坏的想法就是每遇到B后缀就和前面遇到的A后缀比较,这样显然TLE,也没用到height数组的优越性。

但是我们A后缀可以用单调栈维护,这样复杂度即可。

(大致细节:对照代码,tot是暂时存答案的地方,当遇到height数组比单调栈顶小时开始弹出,同时高出height的部分要从tot被扣掉(注意要扣掉(二者之间的后缀数)次,因为他们都重复计算了),只有当A前缀出现的时候才能用tot更新ans)

同理再对A后缀做一遍如上操作,两次答案之和即为最终所求。

(感觉是懂了,还是迷迷糊糊的,可以看这个:https://www.cnblogs.com/CSU3901130321/p/4516109.html

(其实最关键的是两个后缀的公共前缀是他们排名之间所有的height的最小值,所以一遇到变低的height就需要更新了,并且说明之前的所有都被多算了。)

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cctype>
#include<cstdio>
#include<vector>
#include<queue>
#include<cmath>
using namespace std;
typedef long long ll;
const int N=2e5+10;
char s[N];
int n,m,len,rank[N],sa[N],height[N],w[N];
inline bool pan(int *x,int i,int j,int k){
    int ti=i+k<n?x[i+k]:-1;
    int tj=j+k<n?x[j+k]:-1;
    return x[i]==x[j]&&ti==tj;
}
inline void SA_init(){
    int *x=rank,*y=height,r=256;
    for(int i=0;i<r;i++)w[i]=0;
    for(int i=0;i<n;i++)w[s[i]]++;
    for(int i=1;i<r;i++)w[i]+=w[i-1];
    for(int i=n-1;i>=0;i--)sa[--w[s[i]]]=i;
    r=1;x[sa[0]]=0;
    for(int i=1;i<n;i++)
    x[sa[i]]=s[sa[i]]==s[sa[i-1]]?r-1:r++;
    for(int k=1;r<n;k<<=1){
    int yn=0;
    for(int i=n-k;i<n;i++)y[yn++]=i;
    for(int i=0;i<n;i++)
        if(sa[i]>=k)y[yn++]=sa[i]-k;
        for(int i=0;i<r;i++)w[i]=0;
        for(int i=0;i<n;i++)++w[x[y[i]]];
        for(int i=1;i<r;i++)w[i]+=w[i-1];
        for(int i=n-1;i>=0;i--)sa[--w[x[y[i]]]]=y[i];
        swap(x,y);r=1;x[sa[0]]=0;
        for(int i=1;i<n;i++)
            x[sa[i]]=pan(y,sa[i],sa[i-1],k)?r-1:r++;
    }
    for(int i=0;i<n;i++)rank[i]=x[i];
}
inline void height_init(){
    int i,j,k=0;
    for(i=1;i<=n;i++)rank[sa[i]]=i;
    for(i=0;i<n;i++){
        if(k)k--;
        else k=0;
        j=sa[rank[i]-1];
        while(s[i+k]==s[j+k])k++;
        height[rank[i]]=k;
    }
}
ll ans,tot;
int q[N][2],top;
ll solve(){
    ans=tot=top=0;
    for(int i=1;i<=n;i++){
        if(height[i]<m)top=tot=0;
        else{
            int cnt=0;
            if(sa[i-1]<len)cnt++,tot+=height[i]-m+1;
            while(top>0&&height[i]<=q[top-1][0]){
                top--;
                tot-=q[top][1]*(q[top][0]-height[i]);
                cnt+=q[top][1];
            }
            q[top][0]=height[i];q[top++][1]=cnt;
            if(sa[i]>len)ans+=tot;
        }
    }
    tot=top=0;
    for(int i=1;i<=n;i++){
        if(height[i]<m)top=tot=0;
        else{
            int cnt=0;
            if(sa[i-1]>len)cnt++,tot+=height[i]-m+1;
            while(top>0&&height[i]<=q[top-1][0]){
                top--;
                tot-=q[top][1]*(q[top][0]-height[i]);
                cnt+=q[top][1];
            }
            q[top][0]=height[i];q[top++][1]=cnt;
            if(sa[i]<len)ans+=tot;
        }
    }
    return ans;
}
int main(){
    while(scanf("%d",&m)!=EOF&&m){
        scanf("%s",s);
        len=n=strlen(s);
        s[n++]=123;
        scanf("%s",s+n);
        n=strlen(s);
        s[n++]=0;
        SA_init();
        n--;
        height_init();
        printf("%lld\n",solve());
    }
    return 0;
}

+++++++++++++++++++++++++++++++++++++++++++

 +本文作者:luyouqi233。               +

 +欢迎访问我的博客:http://www.cnblogs.com/luyouqi233/+

+++++++++++++++++++++++++++++++++++++++++++

posted @ 2018-02-24 22:03  luyouqi233  阅读(252)  评论(0编辑  收藏  举报