POJ 2774 后缀数组
题意:求两个字符串的最长公共字串(10^5)。枚举字串去匹配是最傻的方法啊。
分析:
很久之前就对后缀数组有所耳闻,是利用基数排序将所有后缀按照字典序排序。
sa[i] 排名第 i 的是后缀 k。
rank[i] 与 sa 互补,rank[i] 后缀 i 排在第几。
height[i] : sa[i-1] 与 sa[i] 的最长公共前缀长度,即:排 i-1 的后缀 和 排 i 的后缀 的最长公共前缀。
代码模板是国家集训的,具体实现不完全清晰。边应用边学习。
本题:将这两个字符串用特殊字符连起来,height 的最大值,即答案,但是height 求的任意的两个后缀的最长公共前缀,那么满足条件是,对应的sa 出现的位置在两个字符串中。
#include <cstdio> #include <cmath> #include <cstring> #include <algorithm> using namespace std; const int maxn = 1000000+ 5; int wa[maxn],wb[maxn],wv[maxn],ww[maxn]; int sa[maxn],lcp[maxn],Rank[maxn],rank1[maxn]; char str[maxn]; inline bool cmp(int *r,int a,int b,int len){ return r[a]==r[b]&&r[a+len]==r[b+len]; } void construct_sa(int n,int m){ int i,j,p,*x=wa,*y=wb,*t; for(i=0;i<m;i++) ww[i]=0; for(i=0;i<n;i++) ww[x[i]=str[i]]++; for(i=1;i<m;i++) ww[i]+=ww[i-1]; for(i=n-1;i>=0;i--) sa[--ww[x[i]]]=i; for(j=p=1;p<n;j<<=1,m=p){ for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++){ if(sa[i]>=j) y[p++]=sa[i]-j; } for(i=0;i<m;i++) ww[i]=0; for(i=0;i<n;i++) ww[wv[i]=x[y[i]]]++; for(i=1;i<m;i++) ww[i]+=ww[i-1]; for(i=n-1;i>=0;i--) sa[--ww[wv[i]]]=y[i]; for(t=x,x=y,y=t,x[sa[0]]=0,p=i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } } void construct_lcp(int n){ for(int i=0;i<=n;i++) rank1[sa[i]]=i; int h=0; lcp[0]=0; for(int i=0;i<n;i++){ int j=sa[rank1[i]-1]; if(h>0) h--; for(;j+h<n&&i+h<n;h++) if(str[i+h]!=str[j+h]) break; lcp[rank1[i]-1]=h; } } char str1[maxn]; int main() { //freopen("in.txt","r",stdin); scanf("%s%s",str,str1); int len1 = strlen(str); int len2 = strlen(str1); str[len1] = '*'; for(int i=0;i<len2;i++) str[len1+1+i] = str1[i]; int n = len1 + len2 + 1; construct_sa(n+1,300); construct_lcp(n); int ans = 0; for(int i=0;i<n;i++) if((sa[i]<len1)!=(sa[i+1]<len1)) ans = max(ans,lcp[i]); printf("%d\n",ans); return 0; }