后缀数组
因为之前了解过一次后缀数组,所以这次看起来也不是特别吃力了
主要就是利用倍增的思想,比如说,一个长度为8的字符串,我们先对长度为1的子串进行排名,然后利用这个信息,对长度为2的字符串进行排名,再排4、8……
一个常见的应用是求height,定义height[i]为排名第i的后缀与排名第i-1的后缀的最长公共前缀,即排名相邻的两个后缀的最长公共前缀。
我们设h[i]=height[rank[i]],不难发现h[i]>=h[i-1]-1,即height[rank[i]]>=height[rank[i-1]],那么,我们只要按照rank的顺序,利用之前的信息做一遍就行了。
#include<cstdio> #include<iostream> #define N 15010 using namespace std; int n,m=26,s[N],sa[N],t1[N],t2[N],c[N]; void DA(){ //先按长度为1的子串基数排序 int *x=t1,*y=t2; for(int i=0;i<m;i++) c[i]=0;//枚举26个字母 for(int i=0;i<n;i++) c[x[i]=s[i]]++;//枚举字符串中的每个字符c[i]=j表示字符i出现了j次 for(int i=1;i<m;i++) c[i]+=c[i-1];//搞个前缀和?? for(int i=n-1;~i;i--) {//相当于对单个字符排序,sa[i]=j表示排第i名的是原串第j个字符 sa[c[x[i]]-1]=i; c[x[i]]--; } for(int k=1,p=0;k<=n;k*=2,m=p,p=0){ //排序第2位 for(int i=n-k;i<n;i++) y[p++]=i;//长度不足l的优先排序,因为基数排序是先按最后一个关键字入桶 for(int i=0;i<n;i++) if(sa[i]>=k) y[p++]=sa[i]-k; //排序第1位 for(int i=0;i<m;i++) c[i]=0; for(int i=0;i<n;i++) c[x[y[i]]]++; for(int i=1;i<m;i++) c[i]+=c[i-1]; for(int i=n-1;~i;i--) sa[--c[x[y[i]]]]=y[i]; //更新x数组 swap(x,y),p=1,x[sa[0]]=0; for(int i=1;i<n;i++)//有相同的x值也相同 if(y[sa[i-1]]==y[sa[i]]&&((y[sa[i-1]+k]==y[sa[i]+k]&&sa[i-1]+k<n&&sa[i]+k<n)||(sa[i-1]+k>=n&&sa[i]+k>=n))) x[sa[i]]=p-1; else x[sa[i]]=p++;//x[i]=j表示以第i个字符为开头的后缀排第j名 if(p>=n) break;//说明所有的排名都不相同 } } int rk[N],ht[N]; void calheight() { for(int i=0;i<n;i++) rk[sa[i]]=i;//rk[i]=j表示以第i个字符为开头的后缀排第j名 for(int i=0,j,k=0;i<n;ht[rk[i++]]=k){//ht[i]排名第i的后缀与排名第i-1的后缀的最长公共前缀长度 if(!rk[i]) continue; j=sa[rk[i]-1],k=k?k-1:0; while(i+k<n&&j+k<n&&s[i+k]==s[j+k]) k++; }ht[0]=0; } int main(){ freopen("Cola.txt","r",stdin); char ch[N]; scanf("%d%s",&n,ch); for(int i=0;i<n;i++) s[i]=ch[i]-'a'; DA();calheight(); for(int i=0;i<n;i++)printf("%d ",sa[i]+1);printf("\n"); for(int i=0;i<n;i++)printf("%d ",ht[i]); return 0; }