SPOJ 687 Repeats(后缀数组+ST表)
【题目链接】 http://www.spoj.com/problems/REPEATS/en/
【题目大意】
求重复次数最多的连续重复子串的长度。
【题解】
考虑错位匹配,设重复部分长度为l,记s[i]和s[i+l]前缀匹配得到的最长长度为r,枚举所有的l和i,得到r,那么答案就是r/l+1的最大值。计算任意后缀的最长公共前缀可以利用后缀数组+ST表来解决,两个后缀的最长公共前缀就是他们名次之间的h数组的最小值。
显然,枚举i和l的复杂度达到了O(n2),是没有办法完成统计的,我们发现每个区段只会存在一个最大值,所以我们以l为步长枚举i,通过计算一次LCP获得这个最长长度的起始位置k,再求一次k位置和k+l位置的LCP,就可以得到这个区段的答案。
【代码】
#include <cstdio> #include <cstring> #include <algorithm> using namespace std; const int N=4000010; int n,m,Rank[N],sa[N],h[N],tmp[N],cnt[N],ans;char s[N],t[N]; void suffixarray(int n,int m){ int i,j,k;n++; for(i=0;i<2*n+5;i++)Rank[i]=sa[i]=h[i]=tmp[i]=0; for(i=0;i<m;i++)cnt[i]=0; for(i=0;i<n;i++)cnt[Rank[i]=s[i]]++; for(i=1;i<m;i++)cnt[i]+=cnt[i-1]; for(i=0;i<n;i++)sa[--cnt[Rank[i]]]=i; for(k=1;k<=n;k<<=1){ for(i=0;i<n;i++){ j=sa[i]-k; if(j<0)j+=n; tmp[cnt[Rank[j]]++]=j; }sa[tmp[cnt[0]=0]]=j=0; for(i=1;i<n;i++){ if(Rank[tmp[i]]!=Rank[tmp[i-1]]||Rank[tmp[i]+k]!=Rank[tmp[i-1]+k])cnt[++j]=i; sa[tmp[i]]=j; }memcpy(Rank,sa,n*sizeof(int)); memcpy(sa,tmp,n*sizeof(int)); if(j>=n-1)break; }for(j=Rank[h[i=k=0]=0];i<n-1;i++,k++) while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=Rank[sa[j]+1]; } int f[N][30],lg2[N]; void rmq_init(int n){ for(int i=2;i<=n;i++)lg2[i]=lg2[i/2]+1; for(int i=1;i<=n;i++)f[i][0]=h[i]; for(int j=1;(1<<j)<=n;j++) for(int i=1;i+(1<<j)-1<=n;i++) f[i][j]=min(f[i][j-1],f[i+(1<<(j-1))][j-1]); } int rmq_min(int l,int r){ if(l>r)swap(l,r);l++; int k=lg2[r-l+1]; return min(f[l][k],f[r-(1<<k)+1][k]); }int T; int main(){ scanf("%d",&T); while(T--){ scanf("%d",&n); for(int i=0;i<n;i++)scanf("%s",s+i); suffixarray(n,128); rmq_init(n); int ans=0; for(int l=1;l<n;l++){ for(int i=0;i+l<n;i+=l){ int r=rmq_min(Rank[i],Rank[i+l]),step=r/l+1,k=i-(l-r%l); if(k>=0&&r%l)if(rmq_min(Rank[k],Rank[k+l])>=r)step++; if(step>ans){ans=step;} } }printf("%d\n",ans); }return 0; }
愿你出走半生,归来仍是少年