后缀数组模板

昨天写了一个后缀数组,发现空间复杂度是nlogn的。

 

改正后的

procedure getrank;
 var
   i,j:longint;
   p,m:int64;
  begin
    m:=100;

    for i:=1 to len do
      rank[i]:=a[i];

    for i:=1 to len do
      inc(sum[rank[i]]);

    for i:=2 to m do
      sum[i]:=sum[i]+sum[i-1];

    for i:=len downto 1 do
      begin
        sa[sum[rank[i]]]:=i;
        dec(sum[rank[i]]);
      end;//此处求出的SA是1..len的一个全排列,在关键字完全相同时i较小的靠前

    trank[sa[1]]:=1;
    p:=1;
    for i:=2 to len do
      begin
        if rank[sa[i]]<>rank[sa[i-1]] then inc(p);
        trank[sa[i]]:=p;
      end;

    for i:=1 to len do rank[i]:=trank[i];
    m:=p;//m表示当前出现最高的rank
    j:=1;//j表示倍增的距离
    while j<len do
      begin
        fillchar(sum,sizeof(sum),0);
        p:=0;
//接下来对第二关键字进行基数排序
for i:=len-j+1 to len do begin inc(p); tsa[p]:=i; end;//这部分第二关键字为0 for i:=1 to len do if sa[i]>j then begin inc(p); tsa[p]:=sa[i]-j; end;//枚举第二关键字sa[i]
//tsa中按第二关键字排序,求出的是1..N的全排列,若第二关键字相同i较小的靠前
for i:=1 to len do trank[i]:=rank[i]; for i:=1 to len do inc(sum[trank[i]]); for i:=2 to m do sum[i]:=sum[i]+sum[i-1];
    //按第一关键字排序,若第一关键字相同,在tsa中靠前的靠前
for i:=len downto 1 do begin sa[sum[trank[tsa[i]]]]:=tsa[i]; dec(sum[trank[tsa[i]]]); end;
//至此,SA以维护
trank[sa[
1]]:=1; p:=1; for i:=2 to len do begin if (rank[sa[i]]<>rank[sa[i-1]]) or (rank[sa[i]+j]<>rank[sa[i-1]+j]) then inc(p); trank[sa[i]]:=p; end; for i:=1 to len do rank[i]:=trank[i]; j:=j*2; m:=p; end; end;

 c++

void getrank(){
    int m=26;
      for (int i=1;i<=n;i++) sum[rank[i]=a[i]]++;
      for (int i=2;i<=m;i++) sum[i]+=sum[i-1];
      for (int i=n;i>=1;i--) sa[sum[rank[i]]--]=i;
      
      trank[sa[1]]=p=1;
      for (int i=2;i<=n;i++) {if(rank[sa[i]]!=rank[sa[i-1]]) p++;trank[sa[i]]=p;}
      for (int i=1;i<=n;i++) rank[i]=trank[i];
      for (int j=1,m=p;j<n;j*=2,m=p){
          p=0;
          for (int i=n-j+1;i<=n;i++) tsa[++p]=i;
          for (int i=1;i<=n;i++) if (sa[i]>j) tsa[++p]=sa[i]-j;
          
          for (int i=1;i<=m;i++) sum[i]=0;
        for (int i=1;i<=n;i++) sum[trank[i]=rank[i]]++;
        for (int i=2;i<=m;i++) sum[i]+=sum[i-1];
        
        for (int i=n;i>=1;i--) sa[sum[trank[tsa[i]]]--]=tsa[i];
        
        trank[sa[1]]=p=1;
         for (int i=2;i<=n;i++){
            if ((rank[sa[i-1]]!=rank[sa[i]])||(rank[sa[i-1]+j]!=rank[sa[i]+j])) p++;//数组大小开两倍,保证sa[i]+j不越界
            trank[sa[i]]=p;
        }
        for (int i=1;i<=n;i++) rank[i]=trank[i];
      }
  }//sum数组小标与字符串长相等

 

posted @ 2016-03-10 11:04  z1j1n1  阅读(230)  评论(0编辑  收藏  举报