spoj 694(后缀数组)

题意:求一个字符串的不重复子串的个数。

分析:对于下标为i的位置,能够产生的前缀子串个数为len-i(下标从0开始),对于与它字典序相邻的后缀产生的子串是重复的(就是他们的最长公共前缀),所以我们要减去这部分重复的,即:len-i-height[i]。

代码实现:

#include<cstdio>
#include<cstring>
#include<iostream>
using namespace std;
int ws1[1005],wv[1005],wa[1005],wb[1005];
int rank[1005],height[1005],sa[1005];
char str[1005];

int cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b] && r[a+l]==r[b+l];
}

void da(char *r,int *sa,int n,int m)
{
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++)
        ws1[i]=0;
    for(i=0;i<n;i++)
        ws1[x[i]=r[i]]++;
    for(i=1;i<m;i++)
        ws1[i]+=ws1[i-1];
    for(i=n-1;i>=0;i--)
        sa[--ws1[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++)
            y[p++]=i;
        for(i=0;i<n;i++)
            if(sa[i]>=j)
                y[p++]=sa[i]-j;
        for(i=0;i<n;i++)
            wv[i]=x[y[i]];
        for(i=0;i<m;i++)
            ws1[i]=0;
        for(i=0;i<n;i++)
            ws1[wv[i]]++;
        for(i=1;i<m;i++)
            ws1[i]+=ws1[i-1];
        for(i=n-1;i>=0;i--)
            sa[--ws1[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

void calheight(char *r,int *sa,int n)
{
    int i,j,k=0;
    for(i=1;i<=n;i++)
        rank[sa[i]]=i;
    for(i=0;i<n;height[rank[i++]]=k)
        for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++) ;
}

int main()
{
    int len,i,T;
    long long res;
    scanf("%d",&T);
    getchar();
    while(T--)
    {
        scanf("%s",str);
        len=strlen(str);
        str[len]=0;
        da(str,sa,len+1,256);
        calheight(str,sa,len);
        res=0;
        for(i=1;i<=len;i++)
            res=res+len-sa[i]-height[i];
        printf("%lld\n",res);
    }
    return 0;
}

 

posted on 2013-08-15 23:04  后端bug开发工程师  阅读(500)  评论(0编辑  收藏  举报

导航