后缀数组模板(倍增法)

/*
罗穗骞大牛的算法,交叉信院的人当真是我们国家最顶尖的人才啊,
我辈只能膜拜,连羡慕嫉妒恨的情绪都没有,究其原因就是差距太大,
不过我辈亦有我辈的坚持,付出数十倍的时间却也能窥见天才所见的一斑,
这便足矣。
我零零碎碎的时间加起来也看了有一整天吧,终于全部弄透彻了,不过我还是没有信心能手写出来,
不过不要紧,慢慢练嘛。
*/
/*
大致思路就是基数排序+倍增,以及根据Height的性质求Height数组
不过有几个小细节需要注意,就是一般在原串的下标n出放上0,然后n+1传到da函数,
然后这个sa[0]就是n了,也就是有用的从sa[1]开始,还有rank,height数组都要注意下。
sa[i]:排名第i后缀的是从原数组下标sa[i]开始的
rank[i]:从下标i开始的后缀在所有后缀中排名第几
height[i]:排名第i的后缀和排名第i-1的后缀的最长公共前缀的长度
H[i]:从下标i开始的后缀和排名为(rank[i]-1)的后缀的最长公共前缀的长度,H[i]=height[rank[i]]
for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
这两行代码的意思是利用前j>>1长度的子串(即第一关键字)的排序结果进行排序。实际上就是后面不足j>>1长度的补0,
所以肯定排在前面,然后i是sa[i]中的次序,所以先被扫到的肯定是排在前面的,所以减去j可以对应次序,所以y中存的是
第二关键字的次序,而不是综合第一关键字顺序的综合次序,综合次序之后会有对应操作
剩下的难点就是求height数组,总不能用n^2的复杂度来,所以就利用了height的性质,即H[i]>=H[i-1]-1
证明+脑补:
假如suffix(k+1)刚好排在suffix(i)的前一个,那么他们的最长公共前缀=1,此时h[i]=h[i-1]-1。
如果suffix(k+1)不排在suffix(i)的前一个,而是前几个,可知在suffix(k+1)和suffix(i)之间插进了一个suffix(l),
可想而知suffix(l)既要比suffix(k+1)大,又要比suffix(i)小,
不用考虑可知suffix(l)与suffix(i)的最长公共前缀>=suffix(k+1)与suffix(i)的最长公共前缀,既h[i]≥h[i-1]-1恒成立。
*/
#include<cstdio>
#include<cstring>

using namespace std;

typedef  long long ll;
const int inf = 0x3f3f3f3f;
const int maxn = 100000+10;
int wa[maxn],wb[maxn],wv[maxn],ws[maxn],sa[maxn],rank[maxn],height[maxn];
int cmp(int *r,int a,int b,int l){
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int *r,int n,int m){
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) ws[i]=0;
    for(i=0;i<n;i++) ws[x[i]=r[i]]++;
    for(i=1;i<m;i++) ws[i]+=ws[i-1];
    for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p){
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) ws[i]=0;
        for(i=0;i<n;i++) ws[wv[i]]++;
        for(i=1;i<m;i++) ws[i]+=ws[i-1];
        for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}
void calHeight(int *r,int n){
    int i,j,k=0;
    for(i=1;i<=n;i++) rank[sa[i]]=i;
    for(i=0;i<n;i++){
        if(k) k-=1;
        j=sa[rank[i]-1];
        while(r[i+k]==r[j+k]) k++;
        height[rank[i]]=k;
    }
}

  

posted @ 2017-12-06 23:38  愿~得偿所愿,不负时光  阅读(314)  评论(0编辑  收藏  举报