【模板】后缀排序(基础版)哈希+二分

构造后缀数组\(SA[\ ]\),即对一个字符串的每个后缀按照字典序排序后得到的数组,在这里采用哈希+二分的方式优化字符串的比较部分,使得复杂度由\(O(n^2*logn)\rightarrow O(n*log^2n)\)

代码如下

#include <bits/stdc++.h>
using namespace std;
const int maxn=1e6+10;
const int base=131;

char s[maxn];
unsigned long long h[maxn],p[maxn];
int height[maxn],sa[maxn],n;

void read_and_parse(){
	scanf("%s",s+1);
	n=strlen(s+1),p[0]=1;
	for(int i=1;i<=n;i++){
		sa[i]=i;
		p[i]=p[i-1]*base;
		h[i]=h[i-1]*base+s[i];
	}
}

inline unsigned long long get(int l,int r){
	return h[r]-h[l-1]*p[r-l+1];
}

int lcp(int x,int y){//最长公共前缀的模板
	int l=0,r=min(n-x+1,n-y+1);
	while(l<r){
		int mid=l+r+1>>1;
		if(get(x,x+mid-1)==get(y,y+mid-1))l=mid;
		else r=mid-1;
	}
	return l;
}

bool cmp(int x,int y){
	int l=lcp(x,y);
	return s[x+l]<s[y+l];
}

void solve(){
	sort(sa+1,sa+n+1,cmp);
	for(int i=2;i<=n;i++)height[i]=lcp(sa[i],sa[i-1]);//height 数组是sa[i]和sa[i-1]的lcp数组
	
	for(int i=1;i<=n;i++)printf("%d%c",sa[i],i==n?'\n':' ');
	for(int i=1;i<=n;i++)printf("%d%c",height[i],i==n?'\n':' ');
}

int main(){
	read_and_parse();
	solve();
	return 0;
}
posted @ 2018-10-26 16:52  shellpicker  阅读(253)  评论(0编辑  收藏  举报