【后缀数组学习中】
小白书 219 页入门
大概懂得后缀数组原理 即后缀排序后的下标所形成的数组
裸的算法是 n*n*logn:直接利用定义 对所有后缀快排........
稍微好点. nlogn的倍增算法 原理懂了
更好点 线性时间的...只是简单涉及了没有
逛逛博客 学习前人优秀代码风格
http://dongxicheng.org/structure/suffix-array/
很好的将几篇国家队论文整合了,题目,介绍都有。好好研究
http://blog.csdn.net/xymscau/article/details/8798046
提供了代码和几个练习题
http://www.cnblogs.com/kuangbin/archive/2013/05/20/3089189.html
kuangbing写的
const int MAXN=300000; char s[MAXN]; int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],n; void build_sa(int m){ int *x=t, *y=t2; for(int i = 0 ; i < m ;i++) c[i] = 0; for(int i = 0 ; i < n ;i++) c[x[i]=s[i]]++; for(int i = 1 ; i < m ;i++) c[i] += c[i-1]; for(int i=n-1 ; i >= 0;i--) sa[--c[x[i]]] = i; for(int k = 1 ; k <= n; k <<=1) { int p=0; //直接利用sa数组排序第二关键字 for(int i = n-k ;i < n ;i++) y[p++]=i; for(int i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i]-k; //基数排序第一关键字 for(int i = 0; i < m; i++) c[i]=0; for(int i = 0; i < n; i++) c[x[y[i]]]++; for(int i = 0; i < m; i++) c[i] += c[i-1]; for(int i = n-1;i >= 0; i--) sa[--c[x[y[i]]]]=y[i]; //根据sa和y数组重新计算新的y数组 swap(x,y); p = 1; x[sa[0]] = 0; for(int i = 1;i < n; i++) x[sa[i]] = y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k] ? p-1: p++; if(p >=n ) break; m=p; } }
以上代码还需好好研究.
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
罗穗骞
后缀数组——处理字符串的有力工具
仔细研读后缀数组基本能全懂了
一.后缀数组代码
1.为什么要在最后加一个很小的在最后呢?(在第九页解释了)
这里可以看到规定s[n]=0 的好处,如果s[a]=s[b] 说明以s[a]或s[b]开头的长度为l的字符串肯定不包括字符s[n]
所以调用s[a+l] 和s[b+l] 不会导致数组下标越界,这样就不需要做特殊判断。
二.后缀数组的应用
2.1 最长公共前缀
height 数组:定义 height[i]= suffix(sa[i-1]) 和 suffix(sa[i]) 的最长公共前缀,也就是排名相邻的两个后缀的最长公共前缀。