//目录

POJ 2774 后缀数组

题意:求两个字符串的最长公共字串(10^5)。枚举字串去匹配是最傻的方法啊。

分析:

很久之前就对后缀数组有所耳闻,是利用基数排序将所有后缀按照字典序排序。

sa[i] 排名第 i 的是后缀 k。

rank[i] 与 sa 互补,rank[i] 后缀 i 排在第几。

height[i] : sa[i-1] 与 sa[i] 的最长公共前缀长度,即:排 i-1 的后缀 和 排 i 的后缀 的最长公共前缀。

 

代码模板是国家集训的,具体实现不完全清晰。边应用边学习。

 

本题:将这两个字符串用特殊字符连起来,height 的最大值,即答案,但是height 求的任意的两个后缀的最长公共前缀,那么满足条件是,对应的sa 出现的位置在两个字符串中。

#include <cstdio>
#include <cmath>
#include <cstring>
#include <algorithm>

using namespace std;

const int maxn = 1000000+ 5;

int wa[maxn],wb[maxn],wv[maxn],ww[maxn];
int sa[maxn],lcp[maxn],Rank[maxn],rank1[maxn];

char str[maxn];

inline bool cmp(int *r,int a,int b,int len){
     return r[a]==r[b]&&r[a+len]==r[b+len];
}
void construct_sa(int n,int m){
     int i,j,p,*x=wa,*y=wb,*t;
     for(i=0;i<m;i++)
         ww[i]=0;
     for(i=0;i<n;i++)
         ww[x[i]=str[i]]++;
     for(i=1;i<m;i++)
         ww[i]+=ww[i-1];
     for(i=n-1;i>=0;i--)
         sa[--ww[x[i]]]=i;
     for(j=p=1;p<n;j<<=1,m=p){
         for(p=0,i=n-j;i<n;i++)
            y[p++]=i;
         for(i=0;i<n;i++){
             if(sa[i]>=j)
                 y[p++]=sa[i]-j;
         }
         for(i=0;i<m;i++)
             ww[i]=0;
         for(i=0;i<n;i++)
             ww[wv[i]=x[y[i]]]++;
         for(i=1;i<m;i++)
             ww[i]+=ww[i-1];
         for(i=n-1;i>=0;i--)
             sa[--ww[wv[i]]]=y[i];
         for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++)
             x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
     }
}
void construct_lcp(int n){
    for(int i=0;i<=n;i++) rank1[sa[i]]=i;
    int h=0;
    lcp[0]=0;
    for(int i=0;i<n;i++){
        int j=sa[rank1[i]-1];
        if(h>0) h--;
        for(;j+h<n&&i+h<n;h++) if(str[i+h]!=str[j+h]) break;
        lcp[rank1[i]-1]=h;
    }
}

char str1[maxn];

int main()
{
    //freopen("in.txt","r",stdin);
    scanf("%s%s",str,str1);

    int len1 = strlen(str);
    int len2 = strlen(str1);
    str[len1] = '*';
    for(int i=0;i<len2;i++)
        str[len1+1+i] = str1[i];
    int n = len1 + len2 + 1;

    construct_sa(n+1,300);
    construct_lcp(n);

    int ans = 0;
    for(int i=0;i<n;i++)
        if((sa[i]<len1)!=(sa[i+1]<len1))
            ans = max(ans,lcp[i]);

    printf("%d\n",ans);

    return 0;
}
View Code

 

posted @ 2017-07-22 10:54  小草的大树梦  阅读(158)  评论(0编辑  收藏  举报