HDU 5679 Substring 后缀数组判重

题意:求母串中有多少不同的包含x字符的子串

分析:(首先奉上FZU官方题解)

  

上面那个题就是SPOJ694 ,其实这两个题一样,原理每次从小到大扫后缀sa数组,加上新的当前后缀的若干前缀,再减去重复的

吐槽:因为打多校的时候忘记了后缀数组(其实是就算记着也不会做这题),所以傻逼了,所以眼看无数人1y这题,让我一度产生了暴力的想法

        还是太弱,太傻逼

#include <iostream>
#include <cmath>
#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <string>
#include <algorithm>
#include <stack>
#include <queue>
#include <set>
#include <map>
#include <utility>
#include <vector>
using namespace std;
typedef long long LL;
const int N = 1e5+5;
int cmp(int *r,int a,int b,int l){
    return (r[a]==r[b]) && (r[a+l]==r[b+l]);
}
// 用于比较第一关键字与第二关键字,
// 比较特殊的地方是,预处理的时候,r[n]=0(小于前面出现过的字符)
int wa[N],wb[N],ww[N],wv[N];
int ran[N],height[N];
void DA(int *r,int *sa,int n,int m){ //此处N比输入的N要多1,为人工添加的一个字符,用于避免CMP时越界
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) ww[i]=0;
    for(i=0;i<n;i++) ww[x[i]=r[i]]++;
    for(i=1;i<m;i++) ww[i]+=ww[i-1];
    for(i=n-1;i>=0;i--) sa[--ww[x[i]]]=i; //预处理长度为1
    for(j=1,p=1;p<n;j*=2,m=p) //通过已经求出的长度J的SA,来求2*J的SA
    {
        for(p=0,i=n-j;i<n;i++) y[p++]=i; // 特殊处理没有第二关键字的
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; //利用长度J的,按第二关键字排序
        for(i=0;i<n;i++) wv[i]=x[y[i]];
        for(i=0;i<m;i++) ww[i]=0;
        for(i=0;i<n;i++) ww[wv[i]]++;
        for(i=1;i<m;i++) ww[i]+=ww[i-1];
        for(i=n-1;i>=0;i--) sa[--ww[wv[i]]]=y[i];  //基数排序部分
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;  //更新名次数组x[],注意判定相同的
    }
}
void calheight(int *r,int *sa,int n){ // 此处N为实际长度
    int i,j,k=0;        // height[]的合法范围为 1-N, 其中0是结尾加入的字符
    for(i=1;i<=n;i++) ran[sa[i]]=i;  // 根据SA求RANK
    for(i=0;i<n; height[ran[i++]] = k ) // 定义:h[i] = height[ rank[i] ]
    for(k?k--:0,j=sa[ran[i]-1]; r[i+k]==r[j+k]; k++); //根据 h[i] >= h[i-1]-1 来优化计算height过程
}
char s[N],inc[3];
int sa[N],n,r[N],T,match[N],kase;
int main(){
    scanf("%d",&T);
    while(T--){
      scanf("%s%s",inc,s);
      n=strlen(s);
      int last=n;
      for(int i=0;i<n;++i)
        r[i]=s[i]-'a'+1;
      for(int i=n-1;i>=0;--i){
      if(s[i]==inc[0])last=i;
        match[i]=last;
      }
      r[n]=0;
      DA(r,sa,n+1,30);
      calheight(r,sa,n);
      LL ans = 0;
      for(int i=1;i<=n;++i){
        int tmp=max(sa[i]+height[i],match[sa[i]]);
        ans+=n-tmp;
      }
      printf("Case #%d: %I64d\n",++kase,ans);
    }
    return 0;
}
View Code

 

 

 

 

  

posted @ 2016-07-29 14:29  shuguangzw  阅读(171)  评论(0编辑  收藏  举报