【BZOJ3277/3473】串/字符串 后缀数组+二分+RMQ+双指针
【BZOJ3277】串
Description
字符串是oi界常考的问题。现在给定你n个字符串,询问每个字符串有多少子串(不包括空串)是所有n个字符串中至少k个字符串的子串(注意包括本身)。
Input
第一行两个整数n,k。 接下来n行每行一个字符串。
Output
输出一行n个整数,第i个整数表示第i个字符串的答案。
Sample Input
3 1 abc a ab
Sample Output
6 1 3
HINT
对于100%的数据,n,k,l<=100000
题解:需要的用的方法好像有点多,但是也比我一开始自己yy的要少,我一开始yy的是后缀数组+主席树+线段树(233)
首先用到这样一个结论,就是如果第i个后缀有x个前缀能被k个串包含,那么第i+1个后缀至少有x-1个前缀能被k个串包含(与height数组的求法类似~)
那么我们先预处理这样一个东西,ls[i]代表从最大的j使得[j,i]中包含k个串([j,i]我指的是height数组上的一段区间)。这个可以用双指针法直接搞。
然后我们仿照height数组的求法,假设后缀i-1有x个合法前缀,那么到第i个后缀的时候我们就从x开始向上枚举,用二分+ST表找出它左(右)边第一个height比它小的位置,再用ls判断一下这段区间是否包含k个串就行了,时间复杂度O(nlogn)。
#include <cstdio> #include <iostream> #include <cstring> #define lson x<<1 #define rson x<<1|1 using namespace std; const int maxn=200010; int num,n,k,len,m,t,sum; int r[maxn],sa[maxn],st[maxn],ra[maxn],rb[maxn],h[maxn],rank[maxn],bel[maxn],s[maxn],last[maxn]; char str[maxn]; int f[maxn][20],Log[maxn],ls[maxn],v[maxn]; long long ans[maxn]; void work() { int i,j,p,*x=ra,*y=rb; for(i=0;i<n;i++) st[x[i]=r[i]]++; for(i=1;i<m;i++) st[i]+=st[i-1]; for(i=n-1;i>=0;i--) sa[--st[x[i]]]=i; for(j=p=1;p<n;j<<=1,m=p) { for(p=0,i=n-j;i<n;i++) y[p++]=i; for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; for(i=0;i<m;i++) st[i]=0; for(i=0;i<n;i++) st[x[y[i]]]++; for(i=1;i<m;i++) st[i]+=st[i-1]; for(i=n-1;i>=0;i--) sa[--st[x[y[i]]]]=y[i]; for(swap(x,y),i=p=1,x[sa[0]]=0;i<n;i++) x[sa[i]]=(y[sa[i]]==y[sa[i-1]]&&y[sa[i]+j]==y[sa[i-1]+j])?p-1:p++; } for(i=1;i<n;i++) rank[sa[i]]=i; for(i=p=0;i<n-1;h[rank[i++]]=p) for(p?p--:0,j=sa[rank[i]-1];r[i+p]==r[j+p];p++); } int query(int a,int b) { if(a>b) return 1<<30; int c=Log[b-a+1]; return min(f[a][c],f[b-(1<<c)+1][c]); } int check(int x,int y) { int L=x,R=n,mid; while(L<R) { mid=L+R>>1; if(query(x+1,mid)>=y) L=mid+1; else R=mid; } if(query(ls[L-1]+1,L-1)>=y) return 1; return 0; } int main() { scanf("%d%d",&num,&k); int i,j,a,p; for(i=1;i<=num;i++) { scanf("%s",str),a=strlen(str); for(j=0;j<a;j++) bel[n]=i,r[n++]=str[j]-'a'+num; last[i]=n,r[n++]=num-i; } m=26+num; work(); for(i=num;i<n;i++) f[i][0]=h[i]; for(i=2;i<=n;i++) Log[i]=Log[i>>1]+1; for(j=1;(1<<j)<n;j++) for(i=num;i+(1<<j)-1<=n;i++) f[i][j]=min(f[i][j-1],f[i+(1<<j-1)][j-1]); for(i=num;i<n&&sum<k;i++) sum+=!s[bel[sa[i]]],s[bel[sa[i]]]++; ls[i-1]=num; for(j=num;i<n;i++) { sum+=!s[bel[sa[i]]],s[bel[sa[i]]]++; for(;j<=i&&sum>=k;j++) s[bel[sa[j]]]--,sum-=!s[bel[sa[j]]]; ls[i]=j-1; } for(i=p=0;i<n;i++) { if(!bel[i]) continue; for(p?p--:0;p<last[bel[i]]-i&&check(rank[i],p+1);p++); ans[bel[i]]+=p; } for(i=1;i<num;i++) printf("%lld ",ans[i]); printf("%lld",ans[num]); return 0; }
| 欢迎来原网站坐坐! >原文链接<