SPOJ 705 Distinct Substrings(后缀数组)

 

【题目链接】 http://www.spoj.com/problems/SUBST1/

 

【题目大意】

  给出一个串,求出不相同的子串的个数。

 

【题解】

  对原串做一遍后缀数组,按照后缀的名次进行遍历,
  每个后缀对答案的贡献为n-sa[i]+1-h[i],
  因为排名相邻的后缀一定是公共前缀最长的,
  那么就可以有效地通过LCP去除重复计算的子串。

 

【代码】

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
const int N=1000005;
int T,Cas=1,n,Rank[N],sa[N],h[N],tmp[N],cnt[N],nxt[N];
char c,s[N];
void suffixarray(int n,int m){
    int i,j,k;n++;
    for(i=0;i<2*n+5;i++)Rank[i]=sa[i]=h[i]=tmp[i]=0;
    for(i=0;i<m;i++)cnt[i]=0;
    for(i=0;i<n;i++)cnt[Rank[i]=s[i]]++;
    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
    for(i=0;i<n;i++)sa[--cnt[Rank[i]]]=i;
    for(k=1;k<=n;k<<=1){
        for(i=0;i<n;i++){
            j=sa[i]-k;
            if(j<0)j+=n;
            tmp[cnt[Rank[j]]++]=j;
        }sa[tmp[cnt[0]=0]]=j=0;
        for(i=1;i<n;i++){
            if(Rank[tmp[i]]!=Rank[tmp[i-1]]||Rank[tmp[i]+k]!=Rank[tmp[i-1]+k])cnt[++j]=i;
            sa[tmp[i]]=j;
        }memcpy(Rank,sa,n*sizeof(int));
        memcpy(sa,tmp,n*sizeof(int));
        if(j>=n-1)break;
    }for(j=Rank[h[i=k=0]=0];i<n-1;i++,k++)
    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=Rank[sa[j]+1];
}
int main(){
    scanf("%d",&T);
    while(T--){
        scanf("%s",s);
        n=strlen(s);
        suffixarray(n,256);
        long long ans=0;
        for(int i=1;i<=n;i++)ans=ans+n-sa[i]-h[i];
        printf("%lld\n",ans);
    }return 0;
}

  

 

posted @ 2016-11-15 22:33  forever97  阅读(338)  评论(0编辑  收藏  举报