回文自动机与等差数列

CF932G Palindrome Partition

Given a string \(s\), find the number of ways to split \(s\) to substrings such that if there are \(k\) substrings \((p_1, p_2, p_3, \dots, p_k)\) in partition, then \(p_i = p_{k - i + 1}\) for all \(i (1 ≤ i ≤ k)\) and \(k\) is even.

Since the number of ways can be large, print it modulo \(10^9 + 7\).

\(2 ≤ |s| ≤ 10^6\).

题解

详细证明见A bit more about palindromes,这里只有配图的感性理解。

题目转化

题目划分成偶数段的要求很奇怪,不过有一个转化。

考虑 \(p_i\)\(p_{k-i+1}\) 两个子串,如果 \(p_i\) 对应的下标区间是 \([pos,pos+len-1]\),那么 \(p_{k-i+1}\) 对应的就是 \([n-pos-len+2,n-pos+1]\)

下面举一些例子来感性理解。当 \(pos=1\) 的时候,

\[s_1=s_{n-len+1}\\ s_2=s_{n-len}\\ \vdots \]

如果我们有一个串 \(s'\) 满足

\[s'=s_1s_ns_2s_{n-1}s_3s_{n-2}\dots \]

那么原来的匹配关系变成了

\[s'_1=s'_{2\cdot len}\\ s'_3=s'_{2\cdot len-2}\\ \vdots \]

于是 \(s\) 中的一对长为 \(len\) 的匹配 \((p_i,p_{k-i+1})\)\(s'\) 中对应了长为 \(2\cdot len\) 的回文前缀。那么问题就转化成了将 \(s'\) 拆分成偶回文串的方案数。

DP设计

\(f[i]\) 表示 \(s'_{1..i}\) 划分为若干长度为偶数的回文串的方案数。得到转移方程:

\[f[i]=\sum_{j}f[j-1] \]

其中,\(s'_{j..i}\) 是回文串。那么,每一个 \(j\) 对应的位置相当于是 \(s'_{1..i}\) 的回文后缀。

构建出回文树之后沿着last跳fail就可以得到所有的 \(j\) 的位置。

hack:

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa...

时间复杂度 \(O(n^2)\)

性质挖掘

假设对于某个位置,它对应的若干回文后缀:

graph1

如果他们的长度>len/2,可以证明他们的长度等差

graph2

证明?根据回文串的性质,上面的那些圈圈都是相等的串。证毕。

如果把这一些看成一组,每一组都至少要÷ 2。所以至多只会有log组。这样能够保证复杂度,所以我们考虑能否一组一组转移。

\(g[x]\) 表示这一组东西的和。因为一组不能直接在串中表示,所以用回文树上的节点来表示。所以,\(g[x]\) 表示从节点 \(x\) 开始,一直到缩短的值不再是当前这个等差的位置产生的贡献的和。

graph3

对于这一组,它产生的贡献就是 \(g[x]=f[j_1]+f[j_2]+f[j_3]\)。(最底下那个是原串)

如何维护这个 \(g[x]\) 呢?往父亲的那些回文后缀看

graph4

他们关于儿子节点对称后的开始位置恰好就是我们要统计的位置,所以 \(g[x] +=g[fa_x]\)。当然前提是 \(fa[x]\) 还在这一组等差的串里面。

但是我们少统计了最上面的最短的那一段 ,所以 \(g[x]+=f[i-len[anc_x]-diff_x]\)

算法设计

经过上述讨论,我们只需要对 \(s’\) 构建回文树,维护出 \(g\) 后,利用log组等差数列的性质暴力更新答案即可。

时间复杂度 \(O(n \log n)\)

CO int N=1000000+10;
namespace PAM{
	int str[N],n;
	int last,tot;
	int ch[N][26],trans[N][26],len[N],fa[N];
	int diff[N],anc[N];
	
	void init(){
		memset(str,-1,sizeof str),n=0;
		last=tot=1;
		len[0]=0,len[1]=-1,fa[0]=fa[1]=1;
		fill(trans[0],trans[0]+26,1);
		diff[0]=0;
	}
	void extend(int c){
		str[++n]=c;
		int p=last;
		if(str[n-len[p]-1]!=str[n]) p=trans[p][c];
		if(!ch[p][c]){
			int cur=++tot;
			len[cur]=len[p]+2;
			fa[cur]=ch[trans[p][c]][c];
			ch[p][c]=cur;
			copy(trans[fa[cur]],trans[fa[cur]]+26,trans[cur]);
			trans[cur][str[n-len[fa[cur]]]]=fa[cur];
			diff[cur]=len[cur]-len[fa[cur]];
			anc[cur]=diff[cur]==diff[fa[cur]]?anc[fa[cur]]:fa[cur];
		}
		last=ch[p][c];
	}
}

char tmp[N],str[N];
int dp[N],ans[N];

int main(){
	scanf("%s",tmp+1);
	int n=strlen(tmp+1);
	if(n&1) return puts("0"),0;
	for(int i=1;i<=n;i+=2) str[i]=tmp[(i+1)/2];
	reverse(tmp+1,tmp+n+1);
	for(int i=2;i<=n;i+=2) str[i]=tmp[i/2];
	PAM::init();
	ans[0]=1;
	for(int i=1;i<=n;++i){
		PAM::extend(str[i]-'a');
		for(int p=PAM::last;p;p=PAM::anc[p]){
			dp[p]=ans[i-PAM::len[PAM::anc[p]]-PAM::diff[p]];
			if(PAM::anc[p]!=PAM::fa[p])
				dp[p]=add(dp[p],dp[PAM::fa[p]]);
			if(~i&1) ans[i]=add(ans[i],dp[p]);
		}
	}
	printf("%d\n",ans[n]);
	return 0;
}

Timus 100500 palidnromes

For every prefix of some given string, determine whether it is possible to split it into 1, 2, 3, 4, 5, …, n non-empty palindromes. Note that if we can split a string into k palindromes then we can split it into k + 2 palindromes.

1 ≤ n ≤ 3 · 105

从标题来看出题人英语水平一般。

题解

跟前面那道题大同小异,维护 \(g[x][0/1]\) 表示划分成偶/奇数段的最小划分数。

从这两道题可以看出来,这个 \(g[x]\) 其实就只是个统计的作用,像线段树一样没有实际意义。

CO int N=300000+10,inf=1e9;
namespace PAM{
	int str[N],n;
	int last,tot;
	int ch[N][26],len[N],fa[N];
	int diff[N],anc[N];
	
	void init(){
		memset(str,-1,sizeof str),n=0;
		last=tot=1;
		len[0]=0,len[1]=-1,fa[0]=fa[1]=1;
		diff[0]=0;
	}
	int get_fail(int x){
		while(str[n-len[x]-1]!=str[n]) x=fa[x];
		return x;
	}
	void extend(int c){
		str[++n]=c;
		int p=get_fail(last);
		if(!ch[p][c]){
			int cur=++tot;
			len[cur]=len[p]+2;
			fa[cur]=ch[get_fail(fa[p])][c];
			ch[p][c]=cur;
			diff[cur]=len[cur]-len[fa[cur]];
			anc[cur]=diff[cur]==diff[fa[cur]]?anc[fa[cur]]:fa[cur];
		}
		last=ch[p][c];
	}
}

char str[N];
int dp[N][2],ans[N][2];

int main(){
	scanf("%s",str+1);
	int n=strlen(str+1);
	PAM::init();
	ans[0][0]=0,ans[0][1]=inf;
	for(int i=1;i<=n;++i){
		PAM::extend(str[i]-'a');
		ans[i][0]=ans[i][1]=inf;
		for(int p=PAM::last;p;p=PAM::anc[p]){
			dp[p][0]=ans[i-PAM::len[PAM::anc[p]]-PAM::diff[p]][0];
			dp[p][1]=ans[i-PAM::len[PAM::anc[p]]-PAM::diff[p]][1];
			if(PAM::fa[p]!=PAM::anc[p]){
				dp[p][0]=min(dp[p][0],dp[PAM::fa[p]][0]);
				dp[p][1]=min(dp[p][1],dp[PAM::fa[p]][1]);
			}
			ans[i][0]=min(ans[i][0],dp[p][1]+1);
			ans[i][1]=min(ans[i][1],dp[p][0]+1);
		}
		printf("%d %d\n",ans[i][1]==inf?-1:ans[i][1],ans[i][0]==inf?-2:ans[i][0]);
	}
	return 0;
}

posted on 2019-12-07 10:26  autoint  阅读(283)  评论(0编辑  收藏  举报

导航