BZOJ4340:[BJOI2015]隐身术(后缀数组,ST表,DFS)

Description

给定两个串A,B。请问B中有多少个非空子串和A的编辑距离不超过K?
所谓“子串”,指的是B中连续的一段。不同位置的内容相同的子串算作多个。
两个串之间的“编辑距离”指的是把一个串变成另一个串需要的最小的操作次数,
每次操作可以插入、删除或者替换一个字符。

Input

第一行一个非负整数K。接下来两行,每行一个由大写字母组成的字符串,分别表示A和B。

Output

输出一行一个整数,表示所求答案。

Sample Input

1
AAA
AABBAAB

Sample Output

5

HINT

对100%的数据,K≤5,两个字符串均非空,长度和小于10^5.

Solution

先把字符串拼起来建个后缀数组。

看到$k$不大,考虑枚举左端点搜索。

设状态$(x,y,z)$表示该考虑$S$串的$x$位置和$T$串的$y$位置,前面已经做了$k$次修改。

每层搜索开始先把$x$和$y$指针往后跳,跳的距离为后缀$x$和后缀$y$的$lcp$的长度。

如果有$x$或者$y$有一个到底了,就说明匹配上了。

设$d$表示剩下的操作次数,较显然的是$d=k-z-(len_S-x)$。

在我们手里还剩下$d$次操作次数的情况下,实际上合法结束位置不仅仅是$y-1$,而是$[y-1-d,y-1+d]$这个区间。这个区间的长度最多只有$2\times k +1$,可以用个前缀和统计一下。

Code

  1 #include<iostream>
  2 #include<cstring>
  3 #include<cstdio>
  4 #define N (200009)
  5 #define LL long long
  6 using namespace std;
  7 
  8 int n,m=125,k,sl,tl,L,R,now,sum[N];
  9 int wa[N],wb[N],wt[N];
 10 int ST[N][18],LOG2[N];
 11 int SA[N],Rank[N],Height[N];
 12 LL ans;
 13 char r[N],s[N],t[N];
 14 
 15 bool cmp(int *y,int a,int b,int k)
 16 {
 17     int arank1=y[a];
 18     int brank1=y[b];
 19     int arank2=a+k>=n?-1:y[a+k];
 20     int brank2=b+k>=n?-1:y[b+k];
 21     return arank1==brank1 && arank2==brank2;
 22 }
 23 
 24 void Build_SA()
 25 {
 26     int *x=wa,*y=wb;
 27     for (int i=0; i<m; ++i) wt[i]=0;
 28     for (int i=0; i<n; ++i) ++wt[x[i]=r[i]];
 29     for (int i=1; i<m; ++i) wt[i]+=wt[i-1];
 30     for (int i=n-1; i>=0; --i) SA[--wt[x[i]]]=i;
 31     
 32     for (int j=1; j<=n; j<<=1)
 33     {
 34         int p=0;
 35         for (int i=n-j; i<n; ++i) y[p++]=i;
 36         for (int i=0; i<n; ++i) if (SA[i]>=j) y[p++]=SA[i]-j;
 37         
 38         for (int i=0; i<m; ++i) wt[i]=0;
 39         for (int i=0; i<n; ++i) ++wt[x[y[i]]];
 40         for (int i=1; i<m; ++i) wt[i]+=wt[i-1];
 41         for (int i=n-1; i>=0; --i) SA[--wt[x[y[i]]]]=y[i];
 42         
 43         m=1; swap(x,y); x[SA[0]]=0;
 44         for (int i=1; i<n; ++i)
 45             x[SA[i]]=cmp(y,SA[i],SA[i-1],j)?m-1:m++;
 46         if (m>=n) break;
 47     }
 48 }
 49 
 50 void Build_Height()
 51 {
 52     for (int i=0; i<n; ++i) Rank[SA[i]]=i;
 53     int k=0;
 54     for (int i=0; i<n; ++i)
 55     {
 56         if (!Rank[i]) continue;
 57         if (k) k--;
 58         int j=SA[Rank[i]-1];
 59         while (r[i+k]==r[j+k]) k++;
 60         Height[Rank[i]]=k;
 61     }
 62 }
 63 
 64 void Build_ST()
 65 {
 66     for (int i=2; i<=n; ++i) LOG2[i]=LOG2[i>>1]+1;
 67     for (int i=0; i<n; ++i)
 68     ST[i][0]=Height[i];
 69     for (int j=1; j<=17; ++j)
 70         for (int i=0; i+(1<<j)-1<n; ++i)
 71             ST[i][j]=min(ST[i][j-1],ST[i+(1<<j-1)][j-1]);
 72 }
 73 
 74 int Query(int l,int r)
 75 {
 76     int k=LOG2[r-l+1];
 77     return min(ST[l][k],ST[r-(1<<k)+1][k]);
 78 }
 79 
 80 void DFS(int x,int y,int z)
 81 {
 82     if (z>k) return;
 83     int l=Rank[x],r=Rank[y];
 84     if (l>r) swap(l,r);
 85     int lcp=Query(l+1,r);
 86     x+=lcp; y+=lcp;
 87     if (x==sl || y==n)
 88     {
 89         int d=k-z-(sl-x);
 90         if (d<0) return;
 91         int l=max(y-1-d,now),r=min(y-1+d,n-1);
 92         L=min(l,L); R=max(r+1,R);
 93         sum[l]++; sum[r+1]--;
 94         return;
 95     }
 96     DFS(x+1,y,z+1); DFS(x,y+1,z+1); DFS(x+1,y+1,z+1);
 97 }
 98 
 99 int main()
100 {
101     scanf("%d%s%s",&k,s,t);
102     sl=strlen(s); tl=strlen(t);
103     for (int i=0; i<sl; ++i) r[n++]=s[i]; r[n++]='#';
104     for (int i=0; i<tl; ++i) r[n++]=t[i];
105     Build_SA(); Build_Height(); Build_ST();
106     for (int i=0; i<tl; ++i)
107     {
108         now=sl+i+1, L=n-1,R=0;
109         DFS(0,sl+i+1,0);
110         for (int j=L; j<=R; ++j) ans+=(sum[j]+=sum[j-1])>0;
111         for (int j=L; j<=R; ++j) sum[j]=0;
112     }
113     printf("%lld\n",ans);
114 }
posted @ 2019-02-21 20:55  Refun  阅读(281)  评论(0编辑  收藏  举报