PAM+回文串border理论

PAM板子

#include <bits/stdc++.h>
using namespace std;
const int maxn = 300000 + 5;

namespace pam {
	int sz, tot, last;
	int cnt[maxn], ch[maxn][26], len[maxn], fail[maxn];
	char s[maxn];

	int node(int l) {  // 建立一个新节点，长度为 l
		sz++;
		memset(ch[sz], 0, sizeof(ch[sz]));
		len[sz] = l;
		fail[sz] = cnt[sz] = 0;
		return sz;
	}

	void clear() {  // 初始化
		sz = -1;
		last = 0;
		s[tot = 0] = '$';
		node(0);
		node(-1);
		fail[0] = 1;
	}

	int getfail(int x) {  // 找后缀回文
		while (s[tot - len[x] - 1] != s[tot]) x = fail[x];
		return x;
	}

	void insert(char c) {  // 建树
		s[++tot] = c;
		int now = getfail(last);
		if (!ch[now][c - 'a']) {
			int x = node(len[now] + 2);
			fail[x] = ch[getfail(fail[now])][c - 'a'];
			ch[now][c - 'a'] = x;
		}
		last = ch[now][c - 'a'];
		cnt[last]++;
	}

	long long solve() {
		long long ans = 0;
		for (int i = sz; i >= 0; i--) {
			cnt[fail[i]] += cnt[i];
		}
		for (int i = 1; i <= sz; i++) {  // 更新答案
			ans = max(ans, 1ll * len[i] * cnt[i]);
		}
		return ans;
	}
}  // namespace pam

char s[maxn];

int main() {
	pam::clear();
	scanf("%s", s + 1);
	for (int i = 1; s[i]; i++) {
		pam::insert(s[i]);
	}
	printf("%lld\n", pam::solve());
	return 0;
}

回文串border理论

最小回文划分

t是s的border，当且仅当|s|-|t|是s的周期。
t是回文串s的后缀，t是s的border当且仅当t是回文串。
t是回文串s的border(\(|s|\le 2|t|\))，s是回文串当且仅当t是回文串。
t是回文串s的border，则|s|-|t|是s的周期，|s|-|t|为s的最小周期，当且仅当t是s的最长回文真后缀。
x是一个回文串，y是x的最长回文真后缀，z是y的最长回文真后缀。令u,v分别为满足x=uy,y=vz的字符串，则有下面三条性质
- |u| \(\ge\) |v|
- 如果|u| > |v| ，那么|u| > |z|
- 如果|u| = |v|，那么u=v。
s的所有回文后缀按照长度排序后，可以划分成 \(\log |s|\) 段等差数列。

优化

回文树上的每个节点 \(u\) 需要多维护两个信息，\(diff[u]\) 和 \(slink[u]\)。\(diff[u]\) 表示节点 \(u\) 和 \(fail[u]\) 所代表的回文串的长度差，即 \(len[u]-len[fail[u]]\)。\(slink[u]\) 表示 \(u\) 一直沿着 fail 向上跳到第一个节点 \(v\)，使得 \(diff[v] \neq diff[u]\)，也就是 \(u\) 所在等差数列中长度最小的那个节点。

根据上面证明的结论，如果使用 \(slink\) 指针向上跳的话，每向后填加一个字符，只需要向上跳 \(O(\log |s|)\) 次。因此，可以考虑将一个等差数列表示的所有回文串的 \(dp\) 值之和（在原问题中指 \(\min\)），记录到最长的那一个回文串对应节点上。

\(g[v]\) 表示 \(v\) 所在等差数列的 \(dp\) 值之和，且 \(v\) 是这个等差数列中长度最长的节点，则 \(g[v]=\sum_{slink[x]=slink[v]} dp[i-len[x]]\)，这里 \(i\) 是当前枚举到的下标。

下面我们考虑如何更新 \(g\) 数组和 \(dp\) 数组。以下图为例，假设当前枚举到第 \(i\) 个字符，回文树上对应节点为 \(x\)。\(g[x]\) 为橙色三个位置的 \(dp\) 值之和（最短的回文串 \(slink[x]\) 算在下一个等差数列中）。\(fail[x]\) 上一次出现位置是 \(i-diff[x]\)（在 \(i-diff[x]\) 处结束），\(g[fail[x]]\) 包含的 \(dp\) 值是蓝色位置。因此，\(g[x]\) 实际上等于 \(g[fail[x]]\) 和多出来一个位置的 \(dp\) 值之和，多出来的位置是 \(i-(len[slink[x]]+diff[x])\)。最后再用 \(g[x]\) 去更新 \(dp[i]\)，这部分等差数列的贡献就计算完毕了，不断跳 \(slink[x]\)，重复这个过程即可。具体实现方式可参考例题代码。

最后，上述做法的正确性依赖于：如果 \(x\) 和 \(fail[x]\) 属于同一个等差数列，那么 \(fail[x]\) 上一次出现位置是 \(i-diff[x]\)。

证明:根据引理 \(1\)，\(fail[x]\) 是 \(x\) 的 border，因此其在 \(i-diff[x]\) 处出现。假设 \(fail[x]\) 在 \((i-diff[x],i)\) 中的 \(j\) 位置出现。由于 \(x\) 和 \(fail[x]\) 属于同一个等差数列，因此 \(2|fail[x]| \ge x\)。多余的 \(fail[x]\) 和 \(i-diff[x]\) 处的 \(fail[x]\) 有交集，记交集为 \(w\)，设串 \(u\) 满足 \(uw=fail[x]\)。用类似引理 \(1\) 的方式可以证明，\(w\) 是回文串，而 \(x\) 的前缀 \(s[i-len[x]+1..j]=uwu\) 也是回文串，这与 \(fail[x]\) 是 \(x\) 的最长回文前缀（后缀）矛盾。

例题：Codeforces 932G Palindrome Partition

给定一个字符串 \(s\)，要求将 \(s\) 划分为 \(t_1, t_2, \dots, t_k\)，其中 \(k\) 是偶数，且 \(t_i=t_{k-i+1}\)，求这样的划分方案数。

题解:构造字符串 \(t= s[0]s[n - 1]s[1]s[n - 2]s[2]s[n - 3] \dots s[n / 2 - 1]s[n / 2]\)，问题等价于求 \(t\) 的偶回文划分方案数，把上面的转移方程改成求和形式并且只在偶数位置更新 \(dp\) 数组即可。时间复杂度 \(O(n \log n)\)，空间复杂度 \(O(n)\)。

#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int mod = 1e9 + 7;
const int maxn = 1000000 + 5;

int add(int x, int y) {
	x += y;
	return x >= mod ? x -= mod : x;
}

namespace pam {
	int sz, tot, last;
	int ch[maxn][26], len[maxn], fail[maxn];
	int cnt[maxn], dep[maxn], dif[maxn], slink[maxn];
	char s[maxn];

	int node(int l) {  // 建立一个长度为 l 的新节点
		sz++;
		memset(ch[sz], 0, sizeof(ch[sz]));
		len[sz] = l;
		fail[sz] = 0;
		cnt[sz] = 0;
		dep[sz] = 0;
		return sz;
	}

	void clear() {  // 初始化
		sz = -1;
		last = 0;
		s[tot = 0] = '$';
		node(0);
		node(-1);
		fail[0] = 1;
	}

	int getfail(int x) {  // 找到后缀回文
		while (s[tot - len[x] - 1] != s[tot]) x = fail[x];
		return x;
	}

	void insert(char c) {  // 建树
		s[++tot] = c;
		int now = getfail(last);
		if (!ch[now][c - 'a']) {
			int x = node(len[now] + 2);
			fail[x] = ch[getfail(fail[now])][c - 'a'];
			dep[x] = dep[fail[x]] + 1;
			ch[now][c - 'a'] = x;
			dif[x] = len[x] - len[fail[x]];
			if (dif[x] == dif[fail[x]])
				slink[x] = slink[fail[x]];
			else
				slink[x] = fail[x];
		}
		last = ch[now][c - 'a'];
		cnt[last]++;
	}
}  // namespace pam

using pam::dif;
using pam::fail;
using pam::len;
using pam::slink;
int n, dp[maxn], g[maxn];
char s[maxn], t[maxn];

int main() {
	pam::clear();
	scanf("%s", s + 1);
	n = strlen(s + 1);
	for (int i = 1, j = 0; i <= n; i++) t[++j] = s[i], t[++j] = s[n - i + 1];
	dp[0] = 1;
	for (int i = 1; i <= n; i++) {
		pam::insert(t[i]);
		for (int x = pam::last; x > 1; x = slink[x]) {
			g[x] = dp[i - len[slink[x]] - dif[x]];
			if (dif[x] == dif[fail[x]]) g[x] = add(g[x], g[fail[x]]);
			if (i % 2 == 0) dp[i] = add(dp[i], g[x]);  // 在偶数位置更新 dp 数组
		}
	}
	printf("%d", dp[n]);
	return 0;
}

posted @ 2023-09-27 14:15 永无岛阅读(76) 评论(0) 收藏举报

刷新页面返回顶部

永无岛

I will start over and over again for you

PAM+回文串border理论

PAM板子

回文串border理论

最小回文划分

优化

公告