后缀数组总结

后缀数组总结

学习后缀数组可以参考2009年国家集训队论文《后缀数组——处理字符串的有力工具》BY罗穗骞
这里只有代码

const int N = 1e6+5;
char s[N];
int n,a[N],t[N],x[N],y[N],SA[N],Rank[N],Height[N],ans;
bool cmp(int i,int j,int k){return y[i]==y[j]&&y[i+k]==y[j+k];}
void getSA()
{
	int m=30;
	for (int i=1;i<=n;++i) ++t[x[i]=a[i]];
	for (int i=1;i<=m;++i) t[i]+=t[i-1];
	for (int i=n;i>=1;--i) SA[t[x[i]]--]=i;
	for (int k=1;k<=n;k<<=1)
	{
		int p=0;
		for (int i=0;i<=m;++i) y[i]=0;
		for (int i=n-k+1;i<=n;++i) y[++p]=i;
		for (int i=1;i<=n;++i) if (SA[i]>k) y[++p]=SA[i]-k;
		for (int i=0;i<=m;++i) t[i]=0;
		for (int i=1;i<=n;++i) ++t[x[y[i]]];
		for (int i=1;i<=m;++i) t[i]+=t[i-1];
		for (int i=n;i>=1;--i) SA[t[x[y[i]]]--]=y[i];
		swap(x,y);
		x[SA[1]]=p=1;
		for (int i=2;i<=n;++i) x[SA[i]]=cmp(SA[i],SA[i-1],k)?p:++p;
		if (p>=n) break;m=p;
	}
	for (int i=1;i<=n;++i) Rank[SA[i]]=i;
	for (int i=1,j=0;i<=n;++i)
	{
		if (j) --j;
		while (a[i+j]==a[SA[Rank[i]-1]+j]) ++j;
		Height[Rank[i]]=j; 
	}
}

\(SA[i]\)表示字典序第\(i\)小的是哪一个后缀
\(Rank[i]\)表示后缀\(i\)是第几小的,显然和\(SA\)互为逆数组
\(Height[i]\)表示\(SA[i]\)\(SA[i-1]\)的最长公共前缀\((lcp)\)
通常可以对\(Height[i]\)维护一个\(ST\)表做到\(O(1)\)查询任意两个后缀的\(lcp\)

posted @ 2018-02-24 21:27  租酥雨  阅读(206)  评论(0编辑  收藏  举报