hdu5769--Substring(后缀数组)

题意:求含有某个字母的某个字符串的不同子串的个数

题解:后缀数组,因为不太了解后缀模版卡了一会,还是很简单的。

把后缀按照字典序排序后,一定是取每个后缀的一些前缀,如果两个后缀排名相邻,那么它们的前缀一定是相同的,height数组纪录,那么就不用重复考虑了。同时要记录里每个字母向后最近的需要出现的字符出现的位置,所取前缀至少要包含这个字母。

记住sa和height数组都是1-n的下标。

//后缀数组
#include <stdio.h>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
typedef long long ll;

const int N = int(2e5)+10;
int cmp(int *r,int a,int b,int l){
    return (r[a]==r[b]) && (r[a+l]==r[b+l]);
}
// 用于比较第一关键字与第二关键字,
// 比较特殊的地方是,预处理的时候,r[n]=0(小于前面出现过的字符)

int wa[N],wb[N],wss[N],wv[N];
int sa[N];        // 排第几的是谁 1~n
int rk[N],     // 谁排第几       
    height[N];    // 排名相邻的两个后缀的最长公共前缀长度:suffix(sa[i-1])和(sa[i]) 的最长公共前缀,
char str[N];
int p[N];

void DA(char *r,int *sa,int n,int m){                    // 此处N比输入的N要多1,为人工添加的一个字符,用于避免CMP时越界
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) wss[i]=0;
    for(i=0;i<n;i++) wss[x[i]=r[i]]++;
    for(i=1;i<m;i++) wss[i]+=wss[i-1];
    for(i=n-1;i>=0;i--) sa[--wss[x[i]]]=i;
    for(j=1,p=1;p<n;j*=2,m=p)
    {
        for(p=0,i=n-j;i<n;i++) y[p++]=i;
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) wss[i]=0;
        for(i=0;i<n;i++) wss[wv[i]]++;
        for(i=1;i<m;i++) wss[i]+=wss[i-1];
        for(i=n-1;i>=0;i--) sa[--wss[wv[i]]]=y[i];
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
    }
}

void calheight(char *r,int *sa,int n){                    // 此处N为实际长度
    int i,j,k=0;                    
    for(i=1;i<=n;i++) rk[sa[i]]=i;
    for(i=0;i<n; height[rk[i++]] = k )
    for(k?k--:0,j=sa[rk[i]-1]; r[i+k]==r[j+k]; k++);
}


int main(int argc, char const *argv[])
{
    //freopen("in", "r", stdin);
    int T;
    cin >> T;
    int cas = 0;
    while (T--) {
        printf("Case #%d: ", ++cas);
        char tmp[10];
        char x;
        scanf("%s%s", tmp, str);
        x = *tmp;
        getchar();
        int pos = -1;
        int n = strlen(str);
        for (int i = n-1; i >= 0; --i) {
            if (str[i] == x) pos = i;
            p[i] = pos;
        }
        DA(str, sa, n+1, 200);
        calheight(str, sa, n);
        ll ans = 0;
        if (p[ sa[1] ] != -1) ans += n - p[ sa[1] ];
        for (int i = 2; i <= n; ++i) {
            int now = sa[i];
            int l = max(now+height[i], p[now]);
            if (p[now] == -1) continue;
            ans += n - l;
        }
        cout << ans << endl;
    }
    return 0;
}

 

posted @ 2016-07-30 23:11  我不吃饼干呀  阅读(401)  评论(0编辑  收藏  举报