后缀数组

定义三个概念:

sa[i]:字典序排名第i位的是谁

rank[i]:第i位的字典序排名

height[i]:排名为i的字符串与前一名的最长前缀

关于sa的求法:

关于height的求法:

当h[i-1]>1时,我们不妨设suffix(k) 为”abcee…”suffix(i-1)为 “abdee…”,前后对照可知它们的最长公共前缀长度为2,那我们现在来考虑suffix(i)=”bdee”,那么排在它前面的是哪一个呢,其实我们不得而知,但是我们知道一个下界,suffix(k+1)=”bcee” 已经给我们提供了一个下界。

代码:

 

#include <bits/stdc++.h>
using namespace std;
#define maxn 1000010
int x[maxn],y[maxn],sa[maxn],height[maxn],
rank[maxn],c[maxn],a[maxn];
char s[maxn];
int n,m;
void asa(int n,int m)
{
  int p=0,f=0;
  for (int i=1;i<=m;i++) c[i]=0;
  for (int i=1;i<=n;i++) c[x[i]=a[i]]++;
  for (int i=1;i<=m;i++) c[i]+=c[i-1];
  for (int i=n;i;i--) sa[c[x[i]]--]=i;
  for(int i=1;i<=n&&p<=n;i<<=1)
  {
     p=0;
     for (int j=n-i+1;j<=n;j++) y[++p]=j;
     for (int j=1;j<=n;j++) 
       if (sa[j]>i) y[++p]=sa[j]-i;
     for (int j=1;j<=m;j++) c[j]=0;
     for (int j=1;j<=n;j++) c[x[y[j]]]++;
     for (int j=1;j<=m;j++) c[j]+=c[j-1];
     for (int j=n;j;j--) sa[c[x[y[j]]]--]=y[j];
     swap(x,y); x[sa[1]]=1; p=2;
     for (int j=2;j<=n;j++)
       x[sa[j]]=y[sa[j]]==y[sa[j-1]]&&y[sa[j]+i]==y[sa[j-1]+i]
       ?p-1:p++;
     m=p;
  } 
  for (int i=1;i<=n;i++) rank[sa[i]]=i;
  for (int i=1;i<=n;i++)
  {
    int j=sa[rank[i]-1];
    if (f) f--;
    while (a[i+f]==a[j+f]) f++;
    height[rank[i]]=f;
  }
}
int lcp(int a,int b)
{  
  int x=rank[a],y=rank[b];
  if (x>y) swap(x,y); x++;
  int z=log2(y-x+1);
  return(min(bz[z][x],bz[z][y-(1<<z)+1]));
} 
int main()
{
  cin>>s;
  int len=strlen(s);
  for (int i=0;i<len;i++) a[++n]=s[i]-' ';
  asa(n,n);
  for (int i=1;i<=n;i++) cout<<sa[i]<<" ";
  return 0;
}

 

 修改 3.7 m大小应与n相同

posted @ 2018-02-19 20:32  尹吴潇  阅读(185)  评论(0编辑  收藏  举报