AtCoder Regular Contest 125

题目传送门：AtCoder Regular Contest 125。

A - Dial Up
B - Squares
C - LIS to Original Sequence
D - Unique Subsequence
E - Snack
F - Tree Degree Subset Sum

A - Dial Up

题意简述

给定一个长度为 \(n\) 的 01 串 \(s\)，和一个长度为 \(m\) 的 01 串 \(t\)。

你有一个 01 串 \(b\)，初始时为空串。你可以执行两种操作：

向左或者向右对 \(s\) 循环移位。
把 \(s\) 的首字符添加到 \(b\) 的末尾。

问是否可能能把 \(b\) 变成 \(t\)，如果可行，求出最少的操作次数。

数据范围：\(1 \le n, m \le 2 \times {10}^5\)。

AC 代码

#include <cstdio>
#include <algorithm>

const int MN = 200005;
const int MM = 200005;

int N, M;
int S[MN], T[MM];
int A, B;

int main() {
	scanf("%d%d", &N, &M);
	for (int i = 1; i <= N; ++i)
		scanf("%d", &S[i]), A += S[i];
	for (int i = 1; i <= M; ++i)
		scanf("%d", &T[i]), B += T[i];
	if ((A == 0 && B == 0) || (A == N && B == M))
		return printf("%d\n", M), 0;
	if (A == 0 || A == N)
		return puts("-1"), 0;
	if ((S[1] == 0 && B == 0) || (S[1] == 1 && B == M))
		return printf("%d\n", M), 0;
	int Ans = N;
	for (int i = 2; i <= N; ++i)
		if (S[i] != S[1])
			Ans = std::min({Ans, i - 2, N - i});
	T[0] = S[1];
	for (int i = 1; i <= M; ++i)
		Ans += T[i] != T[i - 1];
	printf("%d\n", Ans + M);
	return 0;
}

无解是容易判断的：如果 \(s\) 全为一种字符，而 \(t\) 中含有至少一个另一种字符则无解。

添加字符的操作需要恰好执行 \(m\) 次，输出答案的时候加上就行了，那么就是要求出最少的循环移位次数。

如果 \(t\) 全为一种字符，而且恰好就是初始时的 \(s\) 的首字符，那就不需要循环移位，直接输出 \(m\)。

否则是需要至少一次循环移位到另一种字符上的，这一定是选取向左或向右碰到的最近的一个不同的字符。

在第一次需要循环移位的时候（也就是 \(t\) 中第一个不等于 \(s\) 的首字符的字符）移动到那里，然后接下来的每一次切换字符（即 \(t_i \ne t_{i - 1}\)）只需要在那个位置周围抖动一下即可。

据此容易写出代码。

时间复杂度为 \(\mathcal O (n + m)\)。

B - Squares

题意简述

给定正整数 \(n\)，求满足 \(1 \le x, y \le n\) 且 \(x^2 - y\) 为完全平方数的数对 \((x, y)\) 的数量，对 \(998244353\) 取模。

数据范围：\(1 \le n \le {10}^{12}\)。

AC 代码

#include <cstdio>
#include <cmath>

typedef long long LL;
const int Mod = 998244353;

LL N;

int main() {
	scanf("%lld", &N);
	LL S = 0, D = 0, Ans = 0;
	for (int i = 1; ; ++i) {
		S += 2 * i - 1;
		D += 2;
		if (S > N)
			break;
		Ans += (N - S) / D + 1;
	}
	printf("%lld\n", Ans % Mod);
	return 0;
}

要让 \(x^2 - y\) 为完全平方数 \(z^2\)（\(z \ge 0\)），且 \(1 \le x, y \le n\)，那么一定有 \(0 \le z < x \le n\)，且 \(x^2 - z^2 \le n\)。

可以发现就是对差值 \(\le n\) 的完全平方数数对计数，对 \(x \le n\) 的限制是不必需的，因为如果存在 \(x^2 - z^2 \le n\)（满足 \(0 \le z < x\)）则必然有 \(x \le \frac{n + 1}{2}\)，而在数据范围下必然有 \(\frac{n + 1}{2} \le n\)。

即求出此序列中有多少对不同的数的差 \(\le n\)：\([0, 1, 4, 9, 16, 25, 36, 49, \ldots ]\)。

我们考虑做此转换：将序列差分得到 \([1, 3, 5, 7, 9, \ldots ]\)，这是一个等差数列。

然后即是求这个新序列中有多少段非空区间的和 \(\le n\)，然后对区间长度分开考虑：

区间长度为 \(1\)：即是求 \([1, 3, 5, 7, 9, \ldots ]\) 中有多少个数 \(\le n\)。
区间长度为 \(2\)：即是求 \([4, 8, 12, 16, 20, \ldots ]\) 中有多少个数 \(\le n\)。
区间长度为 \(3\)：即是求 \([9, 15, 21, 27, 33, \ldots ]\) 中有多少个数 \(\le n\)。

可以发现每一个都是等差数列，所以每个的答案是很好通过公式计算的，总答案就是每个的答案加起来。

而可以发现每个等差数列的首项都是完全平方数，所以只要枚举 \(\sqrt{n}\) 次这样的等差数列即可。

时间复杂度为 \(\mathcal O \!\left( \sqrt{n} \right)\)。

C - LIS to Original Sequence

题意简述

给出一个长度为 \(k\) 的整数序列 \(a_1, a_2, \ldots , a_k\) 满足此序列严格递增且值域在 \([1, n]\) 内。

可以证明一定存在一个 \(1 \sim n\) 的排列 \(p_1, p_2, \ldots , p_n\)，满足序列 \(a\) 是它的最长上升子序列（LIS）之一。

在所有满足条件的序列 \(p\) 中，输出字典序最小的那个。

数据范围：\(1 \le k \le n \le 2 \times {10}^5\)。

AC 代码

#include <cstdio>

const int MN = 200005;

int N, K;
int B[MN];

int main() {
	scanf("%d%d", &N, &K);
	int j = 1;
	for (int i = 1; i < K; ++i) {
		int x;
		scanf("%d", &x);
		printf("%d ", x);
		B[x] = 1;
		while (B[j]) ++j;
		if (j < x) {
			printf("%d ", j);
			B[j] = 1;
			while (B[j]) ++j;
		}
	}
	for (int i = N; i >= j; i--)
		if (!B[i])
			printf("%d%c", i, " \n"[i == j]);
	return 0;
}

要让字典序最小，我们肯定首先贪心地进行考虑。

显然不能有 \(p_1 < a_1\)，否则加入 \(p_1\) 的话就会增加 LIS 的长度。

当 \(k = 1\) 时显然只能有 \(p = [n, n - 1, \ldots , 2, 1]\)，否则 LIS 长度将至少为 \(2\)。

但是我们可以证明当 \(k \ge 2\) 时，一定可以取 \(p_1 = a_1\) 而仍然存在满足条件的 \(p\)。一个证明角度如下：

取 \(p\) 的第 \(1\) 段为 \(a_1, a_1 - 1, \ldots , 1\)。
取 \(p\) 的第 \(2\) 段为 \(a_2, a_2 - 1, \ldots , a_1 + 1\)。
……
取 \(p\) 的第 \(k - 1\) 段为 \(a_{k - 1}, a_{k - 1} - 1, \ldots , a_{k - 2} + 1\)。
取 \(p\) 的最后一段为 \(n, n - 1, \ldots , a_k, a_k - 1, \ldots , a_{k - 1} + 1\)。

举个例子，如果 \(a = [3, 5, 6, 8]\) 而 \(n = 9\)，令 \(p = [3, 2, 1, 5, 4, 6, 9, 8, 7]\)。

按照上述分段方式，每一段内都是递减的，所以 LIS 在每一段中最多取一个，而存在一种取法取得到序列 \(a\)，所以满足条件。

我们已经让 \(p_1\) 满足字典序尽量小了。但是我们肯定不满足于当 \(a_1 \ge 2\) 时让 \(p_2 = a_1 - 1\)。如果此时让 \(p_2 = 1\) 会如何呢？

我们考虑上文的分段论证法，如果我们仍然可以让整个序列 \(p\) 分成 \(k\) 段，每段内都递减，而 \(a_1 \sim a_k\) 依次存在于每一段内，则此时的 \(p\) 一定是满足条件的。

所以按照此原理，显然当 \(a_1 \ge 2\) 时是可以让 \(p_2 = 1\) 的。即有：

如果 \(a_1 = 1\)，则 \(p_1 = a_1 = 1\)。
如果 \(a_1 \ge 2\)，则 \(p_1 = a_1\)，\(p_2 = 1\)。

但是对于再下一个元素（如果 \(a_1 = 1\) 那就是 \(p_2\) 否则就是 \(p_3\)）呢？

它当然可以为 \(a_2\)（如果 \(k \ge 3\)），这是由上面的构造保证的，但是它又不能在 \([a_1 + 1, a_2 - 1]\) 中，否则会增加 LIS 的长度。

那么我们要减小字典序，就是说要让它小于 \(a_1\)，对于 \(a_1 = 1\) 来说这是不可能的，对于 \(a_1 \ge 2\) 来说这也是不合法的，否则 \([p_2 = 1 , p_3, a_2, a_3, \ldots , a_k]\) 就会成为更长的 LIS。

那么也就是说只能有下一个元素为 \(a_2\)（如果 \(k \ge 3\)）。如果 \(k = 2\) 的话后面就只能从 \(n\) 一路递减下来了。

将这样的过程推广到 \(a\) 后面的每一项（除了最后一项 \(a_k\)），就是：

\(p\) 的下一个元素为 \(a_i\)。
如果最小的可用元素小于 \(a_i\)，则 \(p\) 的下一个元素为这个最小的可用元素。
令 \(i\) 自增 \(1\)，直到 \(i = k\) 为止，此时 \(p\) 的尾部填充从 \(n\) 递减的可用元素。

这样的构造方法，由于上文的分段论证法，是合法的。而它的字典序最小性由每一步的贪心保证。

找最小可用元素维护一个指针即可。时间复杂度为 \(\mathcal O (n)\)。

D - Unique Subsequence

题意简述

给定一个长度为 \(n\) 的序列 \(a_1, a_2, \ldots , a_n\)，且 \(1 \le a_i \le n\)，但可以有重复元素。

求出在它之中作为子序列只出现过恰好一次的非空序列个数，对 \(998244353\) 取模。

注：只出现过恰好一次指的是仅存在唯一下标序列满足 \(a\) 对应下标的子序列为此序列。

数据范围：\(1 \le n \le 2 \times {10}^5\)。

AC 代码

#include <cstdio>

const int Mod = 998244353;
const int MN = 200005;

int N;
int l[MN], v[MN], b[MN];

inline void Add(int i, int x) {
	for (; i <= N; i += i & -i)
		b[i] = (b[i] + x) % Mod;
}
inline int Qur(int i) {
	int s = 0;
	for (; i; i -= i & -i)
		s = (s + b[i]) % Mod;
	return s;
}

int main() {
	scanf("%d", &N);
	int s = 0;
	for (int i = 1; i <= N; ++i) {
		int x;
		scanf("%d", &x);
		int f;
		if (l[x]) {
			f = (s - Qur(l[x] - 1) + Mod) % Mod;
			Add(l[x], Mod - v[x]);
			s = (s - v[x] + Mod) % Mod;
		} else
			f = s + 1;
		Add(i, f);
		s = (s + f) % Mod;
		l[x] = i;
		v[x] = f;
	}
	printf("%d\n", s);
	return 0;
}

我们肯定首先考虑子序列自动机的结构。

可以发现这基本上就是要求“正着走子序列自动机得到的下标字典序最小的子序列位置”，与“反着走得到的下标字典序最大的位置”是一样的。

可以证明这个条件等价于：在子序列自动机上走每一步的时候，例如 \(p_i \to p_{i + 1}\)，这之中必须满足 \(a\) 在下标区间 \([p_i + 1, p_{i + 1} - 1]\) 中不存在另一个 \(a_{p_i}\)。否则 \(p_i\) 就可以移动到那个位置上而保证还是相同的子序列，但下标集合不唯一。同时还需要保证它在子序列自动机最终到达的位置 \(p_k\) 是这个数值 \(a_{p_k}\) 的最后一次出现。

转换一下角度，这即是说 \(p_i\) 是 \(p_{i + 1}\) 的上一次出现 \(a_{p_i}\) 的位置，这和子序列自动机的“\(p_{i + 1}\) 是 \(p_i\) 的下一次出现 \(a_{p_{i + 1}}\) 的位置”是对称的。

也就是说要做 DAG 转移的话，假设当前位置是 \(\boldsymbol{i}\)，上一次出现位置是 \(\boldsymbol{\mathit{last}}\)，那么只接收来自 \(\boldsymbol{[\mathit{last}, i - 1]}\) 中的，是当前最后一次出现的数值的位置的转移。

我们发现这就是限定一段区间内的转移求和，并且会实时更新转移的数组（每计算一个新位置就要把上一次出现位置的转移取消掉）。

这可以通过树状数组实现。时间复杂度为 \(\mathcal O (n \log n)\)。

E - Snack

题意简述

有 \(n\) 种小球，第 \(i\) 种小球的颜色为 \(i\) 并且总共有 \(a_i\) 个。

有 \(m\) 个盒子，第 \(i\) 个盒子中，每一种颜色的小球都不能超过 \(b_i\) 个，而总小球数不能超过 \(c_i\) 个。

求最多能在盒子里装入多少小球。

数据范围：\(1 \le n, m \le 2 \times {10}^5\)。

AC 代码

#include <cstdio>
#include <algorithm>
#include <functional>
#include <climits>

typedef long long LL;
const int MN = 200005;
const int MM = 200005;

int N, M;
LL A[MN], B[MM], C[MM];
int t[MM], per[MM];

int main() {
	scanf("%d%d", &N, &M);
	for (int i = 1; i <= N; ++i) scanf("%lld", &A[i]);
	for (int i = 1; i <= M; ++i) scanf("%lld", &B[i]);
	for (int i = 1; i <= M; ++i) scanf("%lld", &C[i]);
	for (int i = 1; i <= M; ++i) {
		LL tmp = N - C[i] / B[i];
		if (tmp < 0) tmp = 0;
		t[i] = tmp;
		per[i] = i;
	}
	std::sort(per + 1, per + M + 1, [](int i, int j) {
		return t[i] < t[j];
	});
	std::sort(A + 1, A + N + 1);
	LL Ans = LLONG_MAX;
	LL SumC = 0, SumB = 0, SumA = 0;
	for (int i = 1; i <= M; ++i) SumC += C[i];
	int j = 1;
	for (int i = 0; i <= N; ++i) {
		while (j <= M && t[per[j]] == i) {
			SumC -= C[per[j]];
			SumB += B[per[j]];
			++j;
		}
		if (i != 0)
			SumA += A[i];
		Ans = std::min(Ans, SumA + SumC + SumB * (N - i));
	}
	printf("%lld\n", Ans);
	return 0;
}

显然这是一个网络最大流模型。如图所示：

根据最大流最小割定理，我们转成最小割考虑。

如果左边割掉 \(x\) 条边，右边割掉 \(y\) 条边，那么就是左边没割掉的每个点，和右边没割掉的每个点，中间的边都要被割掉。

花费即是：

\[\begin{aligned} &= \sum_{i \in X} a_i + \sum_{i \in Y} c_i + \sum_{i \in (N \setminus X)} \sum_{j \in (M \setminus Y)} b_j \\ &= \sum_{i \in X} a_i + \sum_{i \in Y} c_i + \sum_{i \in (M \setminus Y)} b_i (n - x) \\ &= \sum_{i \in X} a_i + \sum_{i = 1}^{m} \begin{cases} c_i & \text{, if } (i, T) \text{ is cut} \\ b_i (n - x) & \text{, if } (i, T) \text{ is not cut} \end{cases} \end{aligned} \]

再注意到，左侧的 \(a_i\)，只要确定了 \(x\)，如何选取是不影响右侧的，由于是求最小割，所以一定是按 \(a_i\) 从小到大排序后取前缀。

再注意到，右侧的每个点可以自由选择与 \(T\) 之间的边是否被割，也就是可以选取 \(\min(c_i, b_i (n - x))\)。

对于一个固定的 \(i\)，可以解得当 \(\displaystyle x \ge n - \frac{c_i}{b_i}\) 时才会有 \(b_i (n - x) \le c_i\)，否则 \(c_i < b_i (n - x)\)。

令 \(\displaystyle t_i = \max \!\left( \left\lceil n - \frac{c_i}{b_i} \right\rceil\! , 0 \right)\! = \max \!\left( n - \!\left\lfloor \frac{c_i}{b_i} \right\rfloor\! , 0 \right)\)，即如果 \(0 \le x < t_i\) 则取 \(c_i\)，否则取 \(b_i (n - x)\)。

则按照 \(t_i\) 从小到大排序，从小到大枚举 \(x\)，可以双指针统计答案。

时间复杂度为 \(\mathcal O (n \log n + m \log m)\)。

F - Tree Degree Subset Sum

题意简述

有一棵 \(n\) 个结点的无根树，令第 \(i\) 个结点的度数为 \(d_i\)。

求满足条件的数对 \((x, y)\) 的数量：存在一个大小为 \(x\) 的点集使得其中结点的度数之和为 \(y\)。

数据范围：\(2 \le n \le 2 \times {10}^5\)。

题意简述

#include <cstdio>
#include <functional>

typedef long long LL;
const int Inf = 0x3f3f3f3f;
const int MN = 200005;

int N, deg[MN], buk[MN];

int main() {
	scanf("%d", &N);
	for (int i = 1; i <= 2 * N - 2; ++i) {
		int x;
		scanf("%d", &x);
		++deg[x];
	}
	for (int i = 1; i <= N; ++i)
		++buk[deg[i] - 1];
	static int f[MN];
	for (int i = 1; i <= N - 2; ++i) f[i] = Inf;
	for (int i = 1; i <= N - 2; ++i) if (buk[i]) {
		int len = buk[i] + 1;
		static int g[MN];
		for (int j = 0; j < i; ++j) {
			static int que[MN];
			int head = 1, tail = 0;
			for (int k = j; k <= N - 2; k += i) {
				auto v = [&](int x){ return f[x] - x / i; };
				while (head <= tail && v(que[tail]) > v(k)) --tail;
				que[++tail] = k;
				while (que[head] / i <= k / i - len) ++head;
				g[k] = v(que[head]) + k / i;
			}
		}
		for (int k = 0; k <= N - 2; ++k) f[k] = g[k];
	}
	LL Ans = 0;
	for (int i = 0; i <= N - 2; ++i) Ans += std::max((N - f[N - 2 - i]) - f[i] + 1, 0);
	printf("%lld\n", Ans);
	return 0;
}

我们发现树本身并没有什么用，计算出来度数序列后就可以扔了。

这有点像是个背包问题，但是我们不可能存储两维的信息。

看起来 \(\displaystyle \sum_{i = 1}^{n} d_i = 2 n - 2\) 的性质应该是个突破口。

对于这类总和固定的正整数序列，我们知道其中不同的数的个数是 \(\mathcal O \!\left( \sqrt{n} \right)\) 的。但是对本题帮助不大。

我们知道一棵大小大于等于 \(2\) 的树一定有叶子结点。

对应到序列中就是当长度为 \(n\) 的正整数序列的总和为 \(2 n - 2\) 时一定有某个 \(d_i = 1\)。

如果从叶子结点的角度考虑，每加入一个叶子节点，可以让 \(x, y\) 均增加 \(1\)，反之均减少 \(1\)。

也就是 \(y - x\) 的值是不变的，不过这样比较麻烦，我们令所有 \(d_i\) 均减少 \(1\)，这样就变成非负整数序列的总和为 \(n - 2\)。

这样的话就是 \(y\) 不变，\(x\) 自由变化了。要求的东西的数量也不受影响。

关键点来了：我们猜想，对于一个固定的 \(y\) 值，对应的满足条件的 \(x\) 值要么不存在，要么形成一段连续区间。证明：

令这个 \(y\) 对应的最小 \(x\) 为 \(m(y)\)，而最大 \(x\) 为 \(M(y)\)。
我们即是要证明 \(M(y) - m(y) \le 2 z\)，其中 \(z\) 是 \(d_i = 0\) 的数目。
这是因为在 \(x\) 取值最小的方案中，权值为 \(0\) 的元素肯定一个都没取；而在 \(x\) 取值最大的方案中，权值为 \(0\) 的元素肯定全部取到了。
所以调整最小的方案可以取到 \([m(y), m(y) + z]\) 之间的所有 \(x\)，而调整最大的方案可以取到 \([M(y) - z, M(y)]\) 之间的所有 \(x\)。
如果有 \(M(y) - m(y) \le 2 z\) 成立，这两个区间的并即是 \([m(y), M(y)]\)。接下来证明此式确实成立：
我们可以说明任意情况下都有 \(-z \le y - x \le z - 2\)，于是当 \(y\) 固定时所有可能的 \(x\) 之间最多差 \(2 z - 2\)。
我们考虑 \(y - x\) 的意义就是每个元素的权值再减去 \(1\)，即权值 \(\ge -1\) 且总和为 \(-2\) 的情况，而权值恰好为 \(-1\) 的元素有 \(z\) 个。
显然，权值非负的数的权值总和恰好为 \(z - 2\)（因为 \(-2 - z \cdot (-1) = z - 2\)），所以取得再多也不能超过 \(z - 2\)。
所以确实有 \(-z \le y - x \le z - 2\)。证毕。

那么我们只需要求出所有的 \(M(y)\) 和 \(m(y)\) 即可。这就可以通过背包求了，但是朴素做复杂度是 \(\mathcal O (n^2)\) 的。

不过注意到不同的数的个数是 \(\mathcal O \!\left( \sqrt{n} \right)\) 的，所以相当于做多重背包，用单调队列优化即可。

注意要判对于一个 \(y\) 区间为空的情况，即不存在合法的 \(x\)。

一个常数优化手段是注意到如果区间不为空的话，\(M(y) = n - m(n - 2 - y)\)，所以不用做两次背包 DP。

这题中好像二进制分组优化多重背包比直接单调队列跑得快，~~虽然理论上多一个 \(\log\)，我对此并不太确定是什么原理~~。jiangly 指正这里不多 \(\log\)，因为总和为 \(s\) 的正整数序列 \(a\) 的 \(\sum \log c_k\) 为 \(\mathcal O \!\left( \sqrt{n} \right)\)，其中 \(c_k\) 表示 \(a_i = k\) 的个数。

时间复杂度：\(\mathcal O \! \left( n \sqrt{n} \right)\)。

posted @ 2021-08-24 03:52 粉兔阅读(1663) 评论(0) 收藏举报

刷新页面返回顶部

PinkRabbit

Always `continue;` Never `break;`

AtCoder Regular Contest 125

A - Dial Up

B - Squares

C - LIS to Original Sequence

D - Unique Subsequence

E - Snack

F - Tree Degree Subset Sum

公告

Always continue; Never break;

公告

Always `continue;` Never `break;`