算法

顾名思义,就是将后缀按照字典序排序。
考虑倍增的思路,先按长度为len排序,O(n)推出长度为2len的排序,只需要合并两个长度为len的字符串。
rk(i)表示i开始往后长度为当前len的后缀排名,SA(i)为排第i的下标。
合并相当于先按后len个排序(已经得到了),然后再按前len排序,排名相同不改变按后len个排序的顺序。
代码如下:

点击查看代码
void _sort() {
	for(int i = 1; i <= m; i++) c[i] = 0;
	for(int i = 1; i <= n; i++) c[rk[i]]++;
	for(int i = 1; i <= m; i++) c[i] += c[i-1];
	for(int i = n; i >= 1; i--) SA[c[rk[y[i]]]--] = y[i];
}
void _SAS() {
	for(int i = 1; i <= n; i++) rk[i] = s[i], y[i]=i;
	_sort();
	for(int k = 1; k < n; k <<= 1) {
		int cc = 0;
		for(int i = n - k + 1; i <= n; i++)y[++cc] = i;
		for(int i = 1; i <= n; i++)if(SA[i] > k)y[++cc]= SA[i] - k;
		_sort(); swap(tmp, rk); cc = 1; rk[SA[1]] = 1;
		for(int i = 2; i <= n; i++) rk[SA[i]] = (tmp[SA[i]] == tmp[SA[i-1]] && tmp[SA[i] + k] == tmp[SA[i-1] + k]) ? cc:++cc;
		m = cc;
	}
	for(int i = 1; i <= n; i++) printf("%d ", SA[i]); puts("");
}

LCP相关(Height数组)

Height(i)LCP( Suf(SAi),Suf(SAi1) )

H(i):Height(rki)
性质:(后面补证明):H(i)H(i1)1
因此直接从H(i)=H(i1)1开始H(i)++暴力判断。
code:

点击查看代码
	for(int i = 1, j; i <= n; i++) {
		if(rk[i] == 1) continue;
		for(H[i] = max(0, H[i - 1] - 1), j = SA[rk[i] - 1]; s[i + H[i]] == s[j + H[i]]; H[i]++);
		ht[rk[i]] = H[i];
	}

求两后缀LCP

找到它们在SA中的位置,求之间height的最小值。ST预处理一下即可。