【后缀数组】bzoj2217 Secretary

考虑简化问题:计算一个字符串中至少出现两次的最长子串。答案一定会在sa中相邻两个后缀的lcp中。因为后缀的位置在sa中相距越远,其lcp的长度就越短,这是由于字典序的性质决定的。

于是,在s1和s2中间插入字符'\0',然后等价于寻找两个后缀的lcp的最大值,且这两个后缀分属s1、s2。

#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
#define N 20002
int n,tong[N],sa[N],t[N],t2[N];
char s[N];
bool cmp(int *y,int i,int k)
{
	return ((y[sa[i-1]]==y[sa[i]])&&((sa[i-1]+k>=n?-1:y[sa[i-1]+k])==(sa[i]+k>=n?-1:y[sa[i]+k])));
}
void build_sa(int range)
{
	int *x=t,*y=t2;
	memset(tong,0,sizeof(int)*range);
	for(int i=0;i<n;++i) tong[x[i]=s[i]]++;
	for(int i=1;i<range;++i) tong[i]+=tong[i-1];
	for(int i=n-1;i>=0;--i) sa[--tong[x[i]]]=i;
	for(int k=1;k<=n;k<<=1)
	  {
	  	int p=0;
	  	for(int i=n-k;i<n;++i) y[p++]=i;
	  	for(int i=0;i<n;++i) if(sa[i]>=k) y[p++]=sa[i]-k;
	  	memset(tong,0,sizeof(int)*range);
	  	for(int i=0;i<n;++i) tong[x[y[i]]]++;
	  	for(int i=1;i<range;++i) tong[i]+=tong[i-1];
	  	for(int i=n-1;i>=0;--i) sa[--tong[x[y[i]]]]=y[i];
	  	swap(x,y); p=1; x[sa[0]]=0;
	  	for(int i=1;i<n;++i) x[sa[i]]=cmp(y,i,k)?p-1:p++;
	  	if(p>=n) break;
	  	range=p;
	  }
}
int lcp[N],rank[N];
void get_lcp()
{
	int k=0;
	for(int i=0;i<n;++i) rank[sa[i]]=i;
	for(int i=0;i<n;++i) if(rank[i])
	  {
	  	if(k) --k;
	  	int j=sa[rank[i]-1];
	  	while(s[i+k]==s[j+k]) ++k;
	  	lcp[rank[i]]=k;
	  }
}
int T;
char s2[N];
int main()
{
	scanf("%d\n",&T);
	for(;T;--T)
	  {
	  	int ans=0;
	  	gets(s);
	  	int l=strlen(s);
	  	gets(s2);
	  	int l2=strlen(s2);
	  	n=l+l2+1;
	  	memcpy(s+l+1,s2,sizeof(char)*l2);
		build_sa(128);
		get_lcp();
		for(int i=1;i<n;++i) if((sa[i-1]<l&&sa[i]>l)||(sa[i]<l&&sa[i-1]>l))
		  ans=max(ans,lcp[i]);
		printf("Nejdelsi spolecny retezec ma delku %d.\n",ans);
	  }
	return 0;
}
posted @ 2015-04-27 14:59  AutSky_JadeK  阅读(162)  评论(0编辑  收藏  举报
TVアニメ「Charlotte(シャーロット)」公式サイト TVアニメ「Charlotte(シャーロット)」公式サイト