【bzoj2806】 Ctsc2012—Cheat
http://www.lydsy.com/JudgeOnline/problem.php?id=2806 (题目链接)
题意
给出M个字符串组成“标准库”。定义L表示将一个字符串分成若干段,每一段的长度不小于L,其中是在标准库中任一字符串的子串的字符“段”的长度之和不小于原字符串长度之和的90%。N个询问,每个给出一个字符串,求其满足条件的最大的L。
Solution
对于每一个询问,我们在线做,话说离线怎么做,整体二分吗→_→
很显然,这应该是要二分答案,考虑怎么check。我们想到了dp:${f_i}$表示后缀${i}$的最长覆盖长度。
$${f_{i}=Max\{f_{i+1},f_j+j-i\},i+L_0<=j<=R_i+i}$$
其中${L_0}$表示当前二分的答案,${R_i}$表示从第${i}$位开始能够匹配到的最长的连续段长度。注意这个要倒着做→_→
然而这个dp是${O(n^2)}$的,我们还需要优化,加上一个括号:
$${f_i=Max\{f_{i+1},(f_j+j)-i\},i+L_0<=j<=R_i+i}$$
于是${f_j+j}$就只与${j}$有关了,我们考虑单调队列。如果队首因为它的位置${>=R_i+i}$而被踢出了队列,那么它必然不会因为后面串的${R_i}$长度增大而被加回来,因为每往后面挪一格长度只可能+1,然后又因为i会-1,所以就是不变的。
那么我们就可以${O(nlogn)}$的求解每一个询问了。
那么只剩下一个问题,${R_i}$怎么求。考虑后缀数组。将所有串接在一起,求一个后缀数组,然后求出height,那么如果一个后缀是询问串的后缀,与其最近的“标准库”中的后缀的height就是它的${R_i}$。然后倍增构后缀数组就TLE飞了→_→,等下补一发后缀自动机的。
UPD 2017.1.19:
这几天一直在考试,拖到了现在。原来就是把“标准库”中的串用分隔符接起来构后缀自动机,之后每一个询问串在上面跑匹配就可以轻松的求出${R_i}$了,我还写了发后缀自动机构后缀数组,然而分隔符太大了,开不下→_→。
因为之前的dp是倒着求的,所以这里的后缀自动机和匹配都是倒着来的→_→,懒得再去改dp和二分答案了。。
细节
构造后缀数组时桶的大小要注意;求${R_i}$的时候要想清楚→_→。
后缀自动机匹配的时候长度要随着匹配失败跳parent树的移动而改变。
代码(后缀数组)
// bzoj2806 #include<algorithm> #include<iostream> #include<cstdlib> #include<cstring> #include<vector> #include<cstdio> #include<cmath> #include<ctime> #define LL long long #define inf 1<<30 #define Pi acos(-1.0) #define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout); using namespace std; const int maxn=2000010; int f[maxn],S[maxn],a[maxn],vis[maxn],q[maxn],pl[maxn],pr[maxn],R[maxn]; int rank[maxn],sa[maxn],height[maxn]; char s[maxn]; int n,m,ans; namespace Suffix { int wa[maxn],wb[maxn],ww[maxn]; bool cmp(int *r,int a,int b,int l) { return r[a]==r[b] && r[a+l]==r[b+l]; } void da(int *r,int *sa,int n,int m) { int i,j,p,*x=wa,*y=wb; for (i=0;i<=m;i++) ww[i]=0; for (i=1;i<=n;i++) ww[x[i]=r[i]]++; for (i=1;i<=m;i++) ww[i]+=ww[i-1]; for (i=n;i>=1;i--) sa[ww[x[i]]--]=i; for (p=0,j=1;p<n;j*=2,m=p) { for (p=0,i=n-j+1;i<=n;i++) y[++p]=i; for (i=1;i<=n;i++) if (sa[i]>j) y[++p]=sa[i]-j; for (i=0;i<=m;i++) ww[i]=0; for (i=1;i<=n;i++) ww[x[y[i]]]++; for (i=1;i<=m;i++) ww[i]+=ww[i-1]; for (i=n;i>=1;i--) sa[ww[x[y[i]]]--]=y[i]; for (swap(x,y),p=x[sa[1]]=1,i=2;i<=n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j) ? p : ++p; } } void calheight(int *r,int *sa,int n) { for (int i=1;i<=n;i++) rank[sa[i]]=i; for (int k=0,i=1;i<=n;i++) { if (k) k--; int j=sa[rank[i]-1]; while (r[i+k]==r[j+k]) k++; height[rank[i]]=k; } } } using namespace Suffix; bool dp(int x,int L0) { for (int i=pl[x];i<=pr[x];i++) f[i]=0; int l=1,r=1;q[1]=pr[x]+1; for (int i=pr[x]-L0+1;i>=pl[x];i--) { while (l<=r && q[l]>i+R[i]) l++; f[i]=f[i+1]; if (l<=r) f[i]=max(f[i],f[q[l]]+q[l]-i); if (i+L0-1<=pr[x]) { while (l<=r && f[q[r]]+q[r]<f[i+L0-1]+i+L0-1) r--; q[++r]=i+L0-1; } } return 10*f[pl[x]]>=(pr[x]-pl[x]+1)*9; } int main() { scanf("%d%d",&n,&m); int len=0;S[0]=inf; for (int i=1;i<=m;i++) { scanf("%s",s+1); for (int j=1;j<=strlen(s+1);j++) S[++len]=s[j]-'0'; S[++len]=i+2; } for (int i=1;i<=n;i++) { scanf("%s",s+1); int tmp=strlen(s+1); pl[i]=len+1; for (int j=1;j<=tmp;j++) S[++len]=s[j]-'0',vis[len]=1; pr[i]=len; S[++len]=i+m+2; } da(S,sa,len,1000000); calheight(S,sa,len); for (int l=inf,i=2;i<=len;i++) { if (i==2) while (vis[sa[i-1]] && vis[sa[i]] && i<=len) i++; if (!vis[sa[i]]) l=inf; else { l=min(l,height[i]); R[sa[i]]=max(R[sa[i]],l); } } for (int l=inf,i=len-1;i>=1;i--) { if (i==len-1) while (vis[sa[i+1]] && vis[sa[i]] && i>=1) i--; if (!vis[sa[i]]) l=inf; else { l=min(l,height[i+1]); R[sa[i]]=max(R[sa[i]],l); } } for (int i=1;i<=n;i++) { int l=0,r=pr[i]-pl[i]+1,ans=0; while (l<=r) { int mid=(l+r)>>1; if (dp(i,mid)) ans=mid,l=mid+1; else r=mid-1; } printf("%d\n",ans); } return 0; }
代码(后缀自动机)
// bzoj2806 #include<algorithm> #include<iostream> #include<cstdlib> #include<cstring> #include<vector> #include<cstdio> #include<cmath> #include<ctime> #define LL long long #define inf 1<<30 #define Pi acos(-1.0) #define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout); using namespace std; const int maxn=2000010; int f[maxn],q[maxn],R[maxn]; char s[maxn]; int n,m,N,ans; namespace SAM { int par[maxn<<1],len[maxn<<1],pos[maxn<<1],ch[maxn>>1][10]; int last,Dargen,sz; void Extend(int c) { int np=++sz,p=last;last=np; len[np]=len[p]+1; for (;p && !ch[p][c];p=par[p]) ch[p][c]=np; if (!p) par[np]=Dargen; else { int q=ch[p][c]; if (len[p]+1==len[q]) par[np]=q; else { int nq=++sz;len[nq]=len[p]+1; memcpy(ch[nq],ch[q],sizeof(ch[q])); par[nq]=par[q]; par[np]=par[q]=nq; for (;p && ch[p][c]==q;p=par[p]) ch[p][c]=nq; } } } void match() { int ll=0; for (int p=Dargen,i=n;i>=1;i--) { while (p>1 && !ch[p][s[i]-'0']) p=par[p],ll=len[p]; if (ch[p][s[i]-'0']) p=ch[p][s[i]-'0'],ll++; else ll=0; R[i]=ll; } } } using namespace SAM; bool dp(int x,int L0) { for (int i=1;i<=n+1;i++) f[i]=0; int l=1,r=1;q[1]=n+1; for (int i=n-L0+1;i>=1;i--) { while (l<=r && q[l]>i+R[i]) l++; f[i]=f[i+1]; if (l<=r) f[i]=max(f[i],f[q[l]]+q[l]-i); if (i+L0-1<=n) { while (l<=r && f[q[r]]+q[r]<f[i+L0-1]+i+L0-1) r--; q[++r]=i+L0-1; } } return 10*f[1]>=n*9; } int main() { scanf("%d%d",&N,&m); SAM::sz=SAM::Dargen=SAM::last=1; for (int i=1;i<=m;i++) { scanf("%s",s+1); for (int i=strlen(s+1);i>=1;i--) Extend(s[i]-'0'); Extend(2); } for (int i=1;i<=N;i++) { scanf("%s",s+1); n=strlen(s+1); match(); int l=0,r=n,ans=0; while (l<=r) { int mid=(l+r)>>1; if (dp(i,mid)) ans=mid,l=mid+1; else r=mid-1; } printf("%d\n",ans); } return 0; }