【bzoj2806】 Ctsc2012—Cheat

http://www.lydsy.com/JudgeOnline/problem.php?id=2806 (题目链接)

题意

  给出M个字符串组成“标准库”。定义L表示将一个字符串分成若干段,每一段的长度不小于L,其中是在标准库中任一字符串的子串的字符“段”的长度之和不小于原字符串长度之和的90%。N个询问,每个给出一个字符串,求其满足条件的最大的L。

Solution

  对于每一个询问,我们在线做,话说离线怎么做,整体二分吗→_→

  很显然,这应该是要二分答案,考虑怎么check。我们想到了dp:${f_i}$表示后缀${i}$的最长覆盖长度。

$${f_{i}=Max\{f_{i+1},f_j+j-i\},i+L_0<=j<=R_i+i}$$

  其中${L_0}$表示当前二分的答案,${R_i}$表示从第${i}$位开始能够匹配到的最长的连续段长度。注意这个要倒着做→_→

  然而这个dp是${O(n^2)}$的,我们还需要优化,加上一个括号:

$${f_i=Max\{f_{i+1},(f_j+j)-i\},i+L_0<=j<=R_i+i}$$

  于是${f_j+j}$就只与${j}$有关了,我们考虑单调队列。如果队首因为它的位置${>=R_i+i}$而被踢出了队列,那么它必然不会因为后面串的${R_i}$长度增大而被加回来,因为每往后面挪一格长度只可能+1,然后又因为i会-1,所以就是不变的。

  那么我们就可以${O(nlogn)}$的求解每一个询问了。

  那么只剩下一个问题,${R_i}$怎么求。考虑后缀数组。将所有串接在一起,求一个后缀数组,然后求出height,那么如果一个后缀是询问串的后缀,与其最近的“标准库”中的后缀的height就是它的${R_i}$。然后倍增构后缀数组就TLE飞了→_→,等下补一发后缀自动机的。

  UPD 2017.1.19:

  这几天一直在考试,拖到了现在。原来就是把“标准库”中的串用分隔符接起来构后缀自动机,之后每一个询问串在上面跑匹配就可以轻松的求出${R_i}$了,我还写了发后缀自动机构后缀数组,然而分隔符太大了,开不下→_→。

  因为之前的dp是倒着求的,所以这里的后缀自动机和匹配都是倒着来的→_→,懒得再去改dp和二分答案了。。

细节

  构造后缀数组时桶的大小要注意;求${R_i}$的时候要想清楚→_→。

  后缀自动机匹配的时候长度要随着匹配失败跳parent树的移动而改变。

代码(后缀数组)

// bzoj2806
#include<algorithm>
#include<iostream>
#include<cstdlib>
#include<cstring>
#include<vector>
#include<cstdio>
#include<cmath>
#include<ctime>
#define LL long long
#define inf 1<<30
#define Pi acos(-1.0)
#define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout);
using namespace std;

const int maxn=2000010;
int f[maxn],S[maxn],a[maxn],vis[maxn],q[maxn],pl[maxn],pr[maxn],R[maxn];
int rank[maxn],sa[maxn],height[maxn];
char s[maxn];
int n,m,ans;

namespace Suffix {
	int wa[maxn],wb[maxn],ww[maxn];
	bool cmp(int *r,int a,int b,int l) {
		return r[a]==r[b] && r[a+l]==r[b+l];
	}
	void da(int *r,int *sa,int n,int m) {
		int i,j,p,*x=wa,*y=wb;
		for (i=0;i<=m;i++) ww[i]=0;
		for (i=1;i<=n;i++) ww[x[i]=r[i]]++;
		for (i=1;i<=m;i++) ww[i]+=ww[i-1];
		for (i=n;i>=1;i--) sa[ww[x[i]]--]=i;
		for (p=0,j=1;p<n;j*=2,m=p) {
			for (p=0,i=n-j+1;i<=n;i++) y[++p]=i;
			for (i=1;i<=n;i++) if (sa[i]>j) y[++p]=sa[i]-j;
			for (i=0;i<=m;i++) ww[i]=0;
			for (i=1;i<=n;i++) ww[x[y[i]]]++;
			for (i=1;i<=m;i++) ww[i]+=ww[i-1];
			for (i=n;i>=1;i--) sa[ww[x[y[i]]]--]=y[i];
			for (swap(x,y),p=x[sa[1]]=1,i=2;i<=n;i++)
				x[sa[i]]=cmp(y,sa[i-1],sa[i],j) ? p : ++p;
		}
	}
	void calheight(int *r,int *sa,int n) {
		for (int i=1;i<=n;i++) rank[sa[i]]=i;
		for (int k=0,i=1;i<=n;i++) {
			if (k) k--;
			int j=sa[rank[i]-1];
			while (r[i+k]==r[j+k]) k++;
			height[rank[i]]=k;
		}
	}
}
using namespace Suffix;

bool dp(int x,int L0) {
	for (int i=pl[x];i<=pr[x];i++) f[i]=0;
	int l=1,r=1;q[1]=pr[x]+1;
	for (int i=pr[x]-L0+1;i>=pl[x];i--) {
		while (l<=r && q[l]>i+R[i]) l++;
		f[i]=f[i+1];
		if (l<=r) f[i]=max(f[i],f[q[l]]+q[l]-i);
		if (i+L0-1<=pr[x]) {
			while (l<=r && f[q[r]]+q[r]<f[i+L0-1]+i+L0-1) r--;
			q[++r]=i+L0-1;
		}
	}
	return 10*f[pl[x]]>=(pr[x]-pl[x]+1)*9;
}
int main() {
	scanf("%d%d",&n,&m);
	int len=0;S[0]=inf;
	for (int i=1;i<=m;i++) {
		scanf("%s",s+1);
		for (int j=1;j<=strlen(s+1);j++) S[++len]=s[j]-'0';
		S[++len]=i+2;
	}
	for (int i=1;i<=n;i++) {
		scanf("%s",s+1);
		int tmp=strlen(s+1);
		pl[i]=len+1;
		for (int j=1;j<=tmp;j++) S[++len]=s[j]-'0',vis[len]=1;
		pr[i]=len;
		S[++len]=i+m+2;
	}
	da(S,sa,len,1000000);
	calheight(S,sa,len);
	for (int l=inf,i=2;i<=len;i++) {
		if (i==2) while (vis[sa[i-1]] && vis[sa[i]] && i<=len) i++;
		if (!vis[sa[i]]) l=inf;
		else {
			l=min(l,height[i]);
			R[sa[i]]=max(R[sa[i]],l);
		}
	}
	for (int l=inf,i=len-1;i>=1;i--) {
		if (i==len-1) while (vis[sa[i+1]] && vis[sa[i]] && i>=1) i--;
		if (!vis[sa[i]]) l=inf;
		else {
			l=min(l,height[i+1]);
			R[sa[i]]=max(R[sa[i]],l);
		}
	}
	for (int i=1;i<=n;i++) {
		int l=0,r=pr[i]-pl[i]+1,ans=0;
		while (l<=r) {
			int mid=(l+r)>>1;
			if (dp(i,mid)) ans=mid,l=mid+1;
			else r=mid-1;
		}
		printf("%d\n",ans);
	}
	return 0;
}

 代码(后缀自动机)

// bzoj2806
#include<algorithm>
#include<iostream>
#include<cstdlib>
#include<cstring>
#include<vector>
#include<cstdio>
#include<cmath>
#include<ctime>
#define LL long long
#define inf 1<<30
#define Pi acos(-1.0)
#define free(a) freopen(a".in","r",stdin),freopen(a".out","w",stdout);
using namespace std;

const int maxn=2000010;
int f[maxn],q[maxn],R[maxn];
char s[maxn];
int n,m,N,ans;

namespace SAM {
	int par[maxn<<1],len[maxn<<1],pos[maxn<<1],ch[maxn>>1][10];
	int last,Dargen,sz;

	void Extend(int c) {
		int np=++sz,p=last;last=np;
		len[np]=len[p]+1;
		for (;p && !ch[p][c];p=par[p]) ch[p][c]=np;
		if (!p) par[np]=Dargen;
		else {
			int q=ch[p][c];
			if (len[p]+1==len[q]) par[np]=q;
			else {
				int nq=++sz;len[nq]=len[p]+1;
				memcpy(ch[nq],ch[q],sizeof(ch[q]));
				par[nq]=par[q];
				par[np]=par[q]=nq;
				for (;p && ch[p][c]==q;p=par[p]) ch[p][c]=nq;
			}
		}
	}
	void match() {
		int ll=0;
		for (int p=Dargen,i=n;i>=1;i--) {
			while (p>1 && !ch[p][s[i]-'0']) p=par[p],ll=len[p];
			if (ch[p][s[i]-'0']) p=ch[p][s[i]-'0'],ll++;
			else ll=0;
			R[i]=ll;
		}
	}
}
using namespace SAM;

bool dp(int x,int L0) {
	for (int i=1;i<=n+1;i++) f[i]=0;
	int l=1,r=1;q[1]=n+1;
	for (int i=n-L0+1;i>=1;i--) {
		while (l<=r && q[l]>i+R[i]) l++;
		f[i]=f[i+1];
		if (l<=r) f[i]=max(f[i],f[q[l]]+q[l]-i);
		if (i+L0-1<=n) {
			while (l<=r && f[q[r]]+q[r]<f[i+L0-1]+i+L0-1) r--;
			q[++r]=i+L0-1;
		}
	}
	return 10*f[1]>=n*9;
}
int main() {
	scanf("%d%d",&N,&m);
	SAM::sz=SAM::Dargen=SAM::last=1;
	for (int i=1;i<=m;i++) {
		scanf("%s",s+1);
		for (int i=strlen(s+1);i>=1;i--) Extend(s[i]-'0');
		Extend(2);
	}
	for (int i=1;i<=N;i++) {
		scanf("%s",s+1);
		n=strlen(s+1);
		match();
		int l=0,r=n,ans=0;
		while (l<=r) {
			int mid=(l+r)>>1;
			if (dp(i,mid)) ans=mid,l=mid+1;
			else r=mid-1;
		}
		printf("%d\n",ans);
	}
	return 0;
}

 

posted @ 2017-01-17 22:04  MashiroSky  阅读(246)  评论(0编辑  收藏  举报