CF1814D Balancing Weapons

原题明显可以转化为：

给定一个长度为 $n$ 的数组，初始为 $p_i$ 。可以调整元素的值，但第 $i$ 个元素必须是 $a_i$ 的整数倍，并且 必须严格大于 $\boldsymbol 0$ （保证 $p_i$ 初始满足此要求）。求至少修改多少个元素，可以让数组的极差不超过 $k$ 。

首先观察到答案和数组内部顺序无关，即所给数列可看做可重集。这是很经典重要的信息，提示我们第一步可以向两个方向思考：

将数列排序。
对数列求出权值数组，在权值数组上考虑问题。

不过，我的做法并不需要做上面任意一步，但上面这个思维是必须要有的。本题有别的做法必须先对这个数组排序，因为排序后保留不改的元素是一段区间，这是一个非常良好的性质。

首先，修改一定有解。设 $L$ 为所有 $a_i$ 的 $\operatorname{lcm}$ ，我们一定可以将所有 $p_i$ 同时修改为 $L$ （注意这里并没有规定 $p_i$ 的上界，即使 $L$ 可能很大也无所谓）。那也就是说，修改 $n$ 个元素一定可以达成目的。

接下来考虑修改少于 $n$ 个元素的情况，这样以来一定存在一个元素没动。因此，考虑对这 $n$ 个元素，依次钦定第 $i$ 个元素不动考虑问题，就能把修改少于 $n$ 个元素的情况全都考虑到。

接下来钦定第 $x$ 个元素不动。那么必要条件是所有元素必须落入 $[p_x - k, p_x + k]$ 。当然，这个条件不充分，因为这样只能保证极差不超过 $2k$ 。下面，我们称这个区间为 $S(x)$ 。这个区间是建立在数组值域上的，而非下标。

在下面，区间 $[l, r]$ 的长度被认为是 $r - l$ ，即一维坐标轴上点 $l$ 到点 $r$ 这条线段的长度，而非这个区间包含的整数数量 $r - l + 1$ 。那么，若干个数落在长度为 $k$ 的区间内，可以推得这些数的极差不超过 $k$ 。

为让所有元素极差不超过 $k$ ，我们期望所有元素落在 $S(x)$ 内部的一个长度为 $k$ 的小区间内。这样的小区间数量为 $k$ ，可以通式地表示为 $[l, l + k]$ ，其中 $p_x -k \le l \le p_x$ 。

全局小区间的数量不超过 $nk$ ，这个量级可以承受。考虑依次钦定这 $nk$ 个小区间中的每一个，计算将所有元素落入这个小区间的最小代价，然后再对求出的所有最小代价取最小值，作为全局最小代价（答案）。这样一定可以考虑到所有情况，因为任何一种少于 $n$ 个元素的修改方式，都能在 $nk$ 个小区间中找到一个小区间 $P$ ，使得这种修改方式会将所有元素落入 $P$ 内。

关于 $nk$ 这个量级是否可承受：注意到这里确实没有限制 $\sum k$ ，但是只要限制一个 $\sum n$ 就已经足够了。设每组数据规模分别为 $n_1, n_2, n_3, \ldots$ 和 $k_1, k_2, k_3, \ldots$ ，最终的代价有 $n_1k_1 + n_2k_2 + n_3k_3 + \ldots \le K\sum n$ ，其中 $K = \max(k_i)$ ，因此不用限制 $\sum k$ 。

$nk$ 已经将近到极限了，所以计算每个区间最小代价的复杂度不能超过 $\log$ 了（可以均摊）。然而事实上这题卡 $\log$ 的常数所以我就讲讲均摊 $\Theta(1)$ 计算每个区间的方法吧。

枚举区间本身就已经需要区间长度的复杂度，直接爆炸了。所以关键就是找到区间和区间之间的关系加速计算，使得复杂度均摊，降低。

注意到，共 $nk$ 个小区间大体是分成 $n$ 组的，同一个 $x$ 的 $S(x)$ 内部的 $k$ 个小区间是一组。不同组的区间之间基本无关，而同组区间关系密切： $[p_x - k, p_x]$ 和 $[p_x - k + 1, p_x +1]$ 有 $k - 1$ 的长度完全重合，而 $[p_x - k + 1, p_x +1]$ 和 $[p_x - k + 2, p_x + 2]$ 之间也有这种关系……得益于这种高度的重合性，用 双指针 加速计算同组内区间的答案：

维护两个指针 $l = p_x - k$ ， $r = p_x$ ，然后同步向右移动 $l$ 和 $r$ 恰 $k$ 步，就扫描到了 $S(x)$ 内部的这 $k$ 个小区间。如果我们能做到这 $2k$ 次指针移动中，每次移动都能快速更新辅助计算区间最小代价的信息（这里要求 $\Theta(1)$ ），就能做到 $\Theta(k)$ 计算出 $k$ 个小区间的答案，也即均摊 $\Theta(1)$ 。

当然，这里需要提前知道 $[p_x - k, p_x]$ 的信息作为初始状态。不过也可以这么理解：先令 $l = p_x - k$ ， $r = l - 1$ ，也即一个空区间，空区间内部信息一般很平凡。然后再令 $r$ 向右移动 $k +1$ 步，使得信息慢慢更新到 $[p_x - k, p_x]$ ，然后再让 $l$ 和 $r$ 同步向右。这样以来就是 $3k$ 次指针移动，影响较小。虽然我最后实际代码中，是直接计算初始区间，然后直接令 $l = p_x - k$ ， $r = p_x$ 的；但是这个思想可以一定程度简化问题，后面的讲解可以不再考虑初始区间，只考虑指针移动时区间信息的变化，以及怎么快速维护这样的信息变化。

接下来我们关心小区间最小代价的计算方法。显然，已经在小区间内部的 $p_i$ 无需修改，不在的必须修改，所以只要统计小区间内部 $p_i$ 的数量 $c$ ，代价就是 $n - c$ 。因此，我们应该维护小区间内部 $p_i$ 的数量 $c$ 。

那么双指针在移动时可以 $\Theta(1)$ 地快速更新 $c$ 值吗？这不难做到。考虑记录 $\mathrm{cnp}(j) = \sum_{i = 1}^n [p_i = j]$ ，这里我们只关心 $j \in S(x)$ ，也即 $\mathrm{cnp}$ 看做长度为 $2k + 1$ 的数组（代码实际实现时下标手动平移到 $0 \sim 2k$ 即可）。这个记录复杂度是 $\Theta(n)$ 的。

注意虽然 $S(x)$ 的长度是 $2k$ ，但是 $S(x)$ 所含整数元素数量是 $2k + 1$ ，所以 $\mathrm{cnp}$ 的长度（数组的长度指所含元素数）为 $2k + 1$ 。

对于夹在两个双指针之间的区间 $[l, r]$ ，其 $c$ 值是 $\sum\limits_{j = l}^r\mathrm{cnp}(j)$ 。这个信息用双指针维护非常简单：当 $r$ 从 $r' - 1$ 移动到 $r'$ 时， $c$ 自增 $\mathrm{cnp}(r')$ ； $l$ 从 $l'$ 移动到 $l' + 1$ 时， $c$ 自减 $\mathrm{cnp}(l')$ 。

上面的做法比较简单，但有漏洞：上面我们直接默认任何一个不在小区间内的元素，都能落入当前小区间的内部。但这个命题并不正确，因为本题中元素的调整方法在正整数域离散——必须以 $a_i$ 为步长。举个例子， $a_i = 5$ ，小区间 $[7, 9]$ ， $p_i$ 无论如何调整都无法落入该小区间内。

如果出现了这种情况，小区间的 $c$ 可以正常计算，但因为所有元素无法都落入该小区间内，该小区间应当是不合法的，这个小区间的 $\boldsymbol{n - c}$ 不应更新答案。所以，我们还需 快速维护一个区间是否合法。

一个小区间合法，等价于所有元素都存在一个正倍数点落在这个小区间中。

我们尝试标记所有元素的所有落在 $S(x)$ 内部的正倍数点。对于 $a_i$ 的正倍数点 $j \in S(x)$ ，我们记录 $j$ 这个位置是 $a_i$ 的正倍数点。注意，一个位置可以是多个 $\boldsymbol{a_i}$ 的正倍数点。

我们不妨调整 $S(x)$ 的定义为 $[\boldsymbol{\max(p_x - k, 1)}, p_x + k]$ 。这样以来，如果一个数的倍数点落在这个区间内，它一定是正数。那么正数这个条件就不用强调了。同时本题不会涉及到 $<1$ 的值，所以这样调整能保证不会丢掉不应该丢的情况，也同时能减少该大区间内长度为 $k$ 的小区间的数量，有助于减少常数（本题卡常）。

这里先给出枚举且仅枚举到 $t$ 在区间 $[L, R]$ 内的倍数点的思路（这是个常用技能）：

不小于 $L$ 的最小 $t$ 倍数点为 $u = \left\lceil\dfrac L t \right\rceil \times t$ ，不大于 $R$ 的最大 $t$ 倍数点为 $v = \left\lfloor\dfrac R t \right\rfloor \times t$ 。

从 $u$ 到 $v$ 按照 $t$ 的步长跳跃即可枚举到所有 $t$ 在 $[L, R]$ 内的倍数点，并且无多余枚举。

考虑最坏的情况， $a_i = 1$ 。这样以来， $S(x)$ 里的所有位置里，每个位置都是所有元素的倍数点。这样以来标记复杂度直接卡满到 $2nk$ ，我们要处理 $n$ 组小区间，这样总复杂度直接 $n^2k$ 了，不可取。

这意味着若坚持这个做法，我们势必要放弃一些倍数点的记录。下面我给出两种思路，都需要发掘一些性质。

【思路一】

性质：如果存在 $a_i \le k$ ，则任何一个在正整数域上连续的长度为 $k$ 的小区间，都会存在一个 $a_i$ 的倍数点。

该性质可以被一个更强的性质推出：任何一个长度为 $a_i$ 的小区间内，每个数 $\bmod a_i$ 之后恰好构成 $[0, a_i - 1]$ 的整数集。比较明显，不证明了。

因此， $a_i \le k$ 的元素不会影响任何一个小区间的合法性，只需检验是否所有 $a_i > k$ 的元素都存在倍数点落入小区间内。下面，我们称 $a_i > k$ 的元素为 重要元素。

这里又有特别好的性质：单个重要元素的倍数点在任何一个长度不超过 $\boldsymbol k$ 的小区间最多出现一次。假设它出现了，并且是 $t$ ，则 $t + a_i$ 和 $t- a_i$ 都不落在小区间内，其它的更不会。

这个性质又可以推出 单个重要元素的倍数点在任何 $\boldsymbol{S(x)}$ 最多出现两次，因为 $S(x)$ 的长度不超过 $2k$ ，拆分成两个长度不超过 $k$ 的小区间，用上面的性质证明即可。

于是，考虑预处理 $\mathrm{cnm}(j)$ 为 $j$ 是多少个 重要元素 的倍数点（只关心 $j \in S(x)$ ）。根据上面的讨论，这个预处理标记的过程复杂度是 $2n$ 。

小细节：因为单个重要元素 $a_i$ 的倍数点在 $S(x)$ 最多出现两次，所以只要尝试标记【 $\boldsymbol{a_i}$ 的不小于 $\boldsymbol{S(x)}$ 左端点的最小倍数点】 以及【 $\boldsymbol{a_i}$ 的不超过 $\boldsymbol{S(x)}$ 右端点的最大倍数点】，就能将 $a_i$ 在 $S(x)$ 内部的倍数点都标记好了。这里【尝试标记点 $\boldsymbol u$ 】，意思是如果点 $u$ 落在 $S(x)$ 内就标记，否则忽略。

然后维护信息：当前区间内，存在 $s$ 个重要元素的倍数点，这里需保证单个重要元素的多个倍数点只被计数一次。

因为长度为 $k$ 的小区间内部，单个重要元素的倍数点并不会出现多次。因此，当 $r - l = k$ 时，信息 $s = \sum\limits_{j = l}^r\mathrm{cnm}(j)$ 。

维护同 $\mathrm{cnp}$ ：在 $r$ 从 $r' - 1$ 转移到 $r'$ 时， $s$ 自增 $\mathrm{cnm}(r')$ 。 $l$ 从 $l'$ 转移到 $l' + 1$ 时， $s$ 自减 $\mathrm{cnm}(l')$ 。

而一个区间合法，当且仅当 $s$ 与重要元素的数量相等，该判定平凡。

那么本题就做完了。考虑复杂度。

处理每组区间，预处理 $\mathrm{cnp}$ 和 $\mathrm{cnm}$ ，复杂度 $\Theta(n)$ ；双指针扫描复杂度 $\Theta(k)$ 。共有 $n$ 组区间，所以复杂度为 $\Theta(n^2 + nk)$ 。

【思路二】

该思路的关键在于发掘：钦定 $p_x$ 不动时，对于任意一个 $p_i$ ，做以下三种策略之一不劣于做其它策略：

不调整。
调整到不大于 $p_x$ 的最大 $a_i$ 倍数点 $u_i$ （如果未落入 $S(x)$ 就忽略）。
调整到不小于 $p_x$ 的最小 $a_i$ 倍数点 $v_i$ （如果未落入 $S(x)$ 就忽略）。

证明：

考虑钦定 $p_x$ 不动的策略，你钦定所有元素落入的小区间肯定是包含 $p_x$ 的，左端点在 $p_x$ 左侧，右端点在 $p_x$ 右侧的一个区间。设它是 $[l, l + k]$ ，即 $l \le p_x$ ， $l + k \ge p_x$ 。

一个元素一旦被调整，就一定会产生 $1$ 的代价，而与它调整的目标位置无关。

如果我们将 $p_i \ne u_i - ta_i$ 调整到 $u_i - ta_i$ ，它能落入 $[l, l + k]$ ，那么有 $u_i - ta_i \ge l$ ，于是 $u_i \ge l$ 。又因为 $u_i \le p_x \le l + k$ ，所以 $u_i$ 也一定能落入 $[l, l + k]$ 。因为 $p_i \ne u_i - ta_i$ ，所以将 $p_i$ 调整到 $u_i - ta_i$ 也会产生代价，不劣于将 $p_i$ 调整到 $u_i$ 。

对于 $v_i$ ，同理可证将 $p_i$ 调整到 $v_i + ta_i$ 不劣于 $v_i$ 。 $u_i$ 和 $v_i$ 之间一定不存在其它 $a_i$ 倍数点了，所以所有 $p_i$ 的调整方案都已被讨论， $u_i$ 和 $v_i$ 两种调整方案不劣于其它调整方案。

当然注意，如果 $p_i = u_i - ta_i$ ，它可能比 $p_i$ 调整到 $u_i$ 优秀，因为保持 $p_i$ 不动没有代价，调整到 $u_i$ 则有。因此，还有一种策略是不调整，也需要考虑。

综上，我们手动强化条件，任何一个 $p_i$ 都只能保持 $p_i$ ，或者调到 $u_i$ ，或者调到 $v_i$ 。根据上面的讨论，这样的强化不会让原题的最优解发生变动，是可取的。如果这里 $p_i$ ， $u_i$ ， $v_i$ 三个点中，某些点不落在 $S(x)$ 里，就直接忽略。这三个点之间可能有相同的点，可以去重一下。

这样以来，任何一个 $a_i$ 都只用标记最多三个倍数点，我们称之为 重要倍数点。

我们尝试沿用思路一的策略，设 $\mathrm{cnm}(j)$ 为 $j$ 是多少个 $a_i$ 的某个重要倍数点。然后考虑维护双指针所夹区间内【有多少个元素，存在一个重要倍数点落在该区间】，记这个值为 $s$ ，则区间合法当且仅当 $s = n$ 。

然而， $r -l = k$ 时，我们不保证 $[l, r]$ 的答案 $s = \sum_{j = l}^r \mathrm{cnm}(j)$ ，这是因为一个元素的重要倍数点可能落在长度为 $k$ 的小区间内多次，性质并不像思路一那么美好。

不过，这个问题其实等价于经典的数颜色问题。我们考虑 $n$ 种元素对应 $n$ 个颜色， $j$ 是 $a_i$ 的某个重要倍数点等价于 $j$ 这个位置有 $i$ 这种颜色（一个位置可以有多种颜色）。然后问一个区间内部有多少种颜色。

思路一保证了一种颜色只出现在目标区间一次，所以问题简化成对颜色数求和。但事实上，没有这个条件，数颜色种数这个问题用双指针维护也是相当经典简单的。

首先我们更改状态， $\mathrm{cnm}(j)$ 修改成一个集合，它的内容是 $j$ 这个位置的所有颜色种类。然后我们在双指针维护时，新开一个数组 $\mathrm{cnt}(i)$ ，下标域 $[1, n]$ 的正整数，代表第 $i$ 种元素在当前双指针所夹区间内出现多少次。

然后进行如下维护：

$r$ 从 $r' - 1$ 转移到 $r’$ 时，将 $r'$ 处的所有颜色 $i$ 进行如下操作：
- 如果 $\mathrm{cnt}(i) = 0$ ，则 $s$ 自增 $1$ 。
- 将 $\mathrm{cnt}(i)$ 自增 $1$ 。
$l$ 从 $l'$ 转移到 $l' + 1$ 时，将 $l'$ 处的所有颜色 $i$ 进行如下操作：
- 将 $\mathrm{cnt}(i)$ 自减 $1$ 。
- 如果 $\mathrm{cnt}(i) = 0$ ，将 $s$ 自减 $1$ 。

上面的转移正确性比较明显。其复杂度虽然不能保证每次运动 $\Theta(1)$ ，但可以保证指针运动的全过程中，复杂度不会超过标记出的所有颜色数，也即 $3k$ 。均摊下来还是 $\Theta(1)$ 的。

那么这个做法也做完了，复杂度同理是 $\Theta(n^2 + nk)$ 。

下面给出做法一的 AC 代码，最大 234 ms，无任何故意的卡常，还是比较优秀的。

/*
 * @Author: crab-in-the-northeast 
 * @Date: 2023-07-11 11:17:47 
 * @Last Modified by: crab-in-the-northeast
 * @Last Modified time: 2023-07-11 17:58:41
 */
#include <bits/stdc++.h>
#define int long long
inline int read() {
	int x = 0;
	bool f = true;
	char ch = getchar();
	for (; !isdigit(ch); ch = getchar())
		if (ch == '-')
			f = false;
	for (; isdigit(ch); ch = getchar())
		x = (x << 1) + (x << 3) + (ch ^ '0');
	return f ? x : (~(x - 1));
}
inline bool gmi(int &a, int b) {
	return b < a ? a = b, true : false;
}

const int N = 3005;
int a[N], p[N];
inline int solve() {
	int n = read(), k = read();
	int ans = n, cnt = 0;
	for (int i = 1; i <= n; ++i) {
		a[i] = read();
		cnt += a[i] > k;
	}
	for (int i = 1; i <= n; ++i)
		p[i] = read() * a[i];
	for (int x = 1; x <= n; ++x) {
		std :: vector <int> cnp((k << 1) + 1), cnm((k << 1) + 1);
		// 注意这里一定要开成 k * 2 + 1
		// 如果你平移到从 1 开始，那就得开成 k * 2 + 2
		int L = std :: max(p[x] - k, 1LL), R = p[x] + k;
		auto ins = [&](std :: vector <int>& v, int pos) {
			if (pos >= L && pos <= R)
				++v[pos - L];
		};
		for (int i = 1; i <= n; ++i) {
			ins(cnp, p[i]);	
			int u = (L + a[i] - 1) / a[i] * a[i], v = R / a[i] * a[i];
			if (a[i] > k) {
				ins(cnm, u);
				if (u != v)
					ins(cnm, v);
			}
		}
		int c = std :: accumulate(cnp.begin(), cnp.begin() + k + 1, 0LL);
		int s = std :: accumulate(cnm.begin(), cnm.begin() + k + 1, 0LL);
		for (int l = L, r = l + k; ;) {
			if (s == cnt)
				gmi(ans, n - c);
			++r;
			if (r > R)
				break;
			c += cnp[r - L] - cnp[l - L];
			s += cnm[r - L] - cnm[l - L];
			++l;
		} 
	}
	return ans;
}

signed main() {
	int T = read();
	while (T--)
		printf("%lld\n", solve());
	return 0;
}

如果您是从洛谷博客来这里的，觉得这篇题解解决了您的问题，写的不错的话，别忘了回到洛谷题解区，给我题解点个赞！

posted @ 2023-07-11 18:03 dbxxx 阅读(69) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· [luogu p8338] [AHOI2022] 排列

· P2827 NOIP2016 提高组蚯蚓

· 2023~2024 赛季模拟赛记录

· 8月做题记录

· 杂题选写1

阅读排行：
· 单线程的Redis速度为什么快？
· 展开说说关于C#中ORM框架的用法！
· Pantheons：用 TypeScript 打造主流大模型对话的一站式集成库
· SQL Server 2025 AI相关能力初探
· 为什么退出登录或修改密码无法使 token 失效

公告

昵称： dbxxx
园龄： 6年
粉丝： 66
关注： 10

+加关注

2025年3月

日

一

二

三

四

五

六

dbxxx

你好！欢迎来访我的博客。

CF1814D Balancing Weapons

公告

搜索

最新随笔

随笔分类 (199)

阅读排行榜

推荐排行榜

最新评论