poj 2774

用的是后缀数组,对于串s1,s2求最长公共子串,最原始的想法就是比较两个串的所有后缀之间的最长公共前缀,可有通过后缀数组优化,先把s1,s2连起来,中间加一个不在s1,s2中的任意一个字符。这样,新形成的串的后缀可以分为两类,一类是包含s1中字符的后缀,一类就是不包含s1中字符的后缀,最后的结果也就是这两类后缀之间的最长公共前缀。额外添加的那个字符的作用就体现于此,这两类后缀的最长公共前缀,也就是s1和s2之间的最长公共前缀,因为这两类后缀的最长公共前缀,肯定在额外添加的那个字符之前就已经匹配结束了,理由显而易。然后接下来就是求这两类后缀的最长公共前缀,只要在得height数组时,比较一下就可以了,理由很容易就可证出。

#include <iostream>
#include <cstdio>
#include <cstring>
using namespace std;
const int maxn=200000+10;
char s1[maxn],s2[maxn];
int sa[maxn],c[maxn],t[maxn*2],t2[maxn*2],ran[maxn],height[maxn];
int n,len1,len2;
void build_sa(int m)
{
    int i ,*x=t,*y=t2;
    for(i=1;i<m;i++) c[i]=0;
    for(i=0;i<n;i++) c[x[i]=s1[i]-'a'+1]++;
    for(i=2;i<m;i++) c[i]+=c[i-1];
    for(i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
    for(int k=1;k<=n;k<<=1)
    {
        int p=0;
        for(i=n-k;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k;
        for(i=1;i<m;i++) c[i]=0;
        for(i=0;i<n;i++) c[x[y[i]]]++;
        for(i=1;i<m;i++) c[i]+=c[i-1];
        for(i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=2;
        x[sa[0]]=1;
        for(i=1;i<n;i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        if(p>=n) break;
        m=p;
    }
}
int getHeight()
{
    int i,j,k=0;
    int ans=0;
    for(i=0;i<n;i++)
        ran[sa[i]]=i;
    for(i=0;i<n;i++)
    {
        if(k) k--;
        if(ran[i])
        {
        int j=sa[ran[i]-1];
        while(s1[i+k]==s1[j+k]) k++;
        height[ran[i]]=k;
        if((sa[ran[i]]>len1&&sa[ran[i]-1]<len1)||(sa[ran[i]]<len1&&sa[ran[i]-1]>len1))
            ans=max(ans,height[ran[i]]);
        }
    }
    return ans;
}
int main()
{
    scanf("%s%s",s1,s2);
    len1=strlen(s1),len2=strlen(s2);
    s1[len1]='a'+26;
    int i,j;
    for(i=0;i<len2;i++) s1[len1+i+1]=s2[i];
    n=len1+i+1;
    build_sa(28);
    int ans=getHeight();
    printf("%d\n",ans);
    return 0;
}



posted @ 2013-04-24 19:15  LJ_COME!!!!!  阅读(124)  评论(0编辑  收藏  举报