LeetCode 小水题选做(更新中)

LeetCode 小水题选做

4. 寻找两个正序数组的中位数

题目链接

题目大意

给定两个排好序的数组 \(a, b\),长度分别为 \(n, m\)。设 \(c\) 为把 \(a\)\(b\) 合并后再排好序的数组,求 \(c\) 的中位数。要求时间复杂度 \(\mathcal{O}(\log(n + m))\)(不计输入)。


一、初步转化:如何避免关于中位数的繁杂分类讨论

首先,根据 \(n + m\) 的奇偶性不同,中位数的定义略有不同。考虑将所有 \(n + m\) 个数放在一起,排好序,记为数列 \(c\)。则当 \(n + m\) 为奇数时,中位数是 \(c\) 里第 \(\lfloor\frac{n + m}{2}\rfloor + 1\) 个数;当 \(n + m\) 为偶数时,中位数是 \(c\) 里第 \(\frac{n + m}{2}\) 个数和第 \(\frac{n + m}{2} + 1\) 个数的平均数。如果我们能实现一个函数,传入 \(k\),返回 \(c\) 中第 \(k\) 个数,那么原问题自然也就迎刃而解了。

至此,我们把原问题转化为:

给出数列 \(a, b\) 和数字 \(k\),要求在 \(\mathcal{O}(\log(n + m))\) 时间里求出 \(c\) 中第 \(k\) 个数。

于是我们成功避免了关于中位数的繁杂分类讨论。接下来考虑转化后的问题。

二、一些不成熟的想法(想看正解可以跳过本节)

第一想法是先把两个数组归并排序,但是这样做时间复杂度至少为 \(\mathcal{O}(n + m)\)

另一想法是二分:不妨假设答案在 \(a\) 中,那么我们在 \(a\) 里二分答案。在 \(\text{check}\) 时,我们要求出当前的 \(a_{\text{mid}}\)\(c\) 里排第几,也就是说 \(a\)\(b\) 中一共有多少个比 \(a_{\text{mid}}\) 小的数。\(a\) 里显然有 \(\text{mid} - 1\) 个,而求 \(b\) 里有多少个,则需要在 \(b\) 里再次二分(或者用 \(\texttt{C++}\) 自带的 lower_bound,时间复杂度是一样的)。于是,两次二分套起来,总时间复杂度是 \(\mathcal{O}(\log^2(n + m))\),仍不能令人满意。

三、真正解法

\(c\) 里的数要么来自 \(a\),要么来自 \(b\)。考虑 \(c\) 的前 \(k\) 个数中,有多少个数来自 \(a\),记为 \(x\)。则有 \(k - x\) 个数来自 \(b\)。那么,必定有:\(\max(a_x, b_{k - x}) \leq \min(a_{x + 1}, b_{k - x + 1})\),因为 \(c\)\(k\) 个数中任意一个,一定小于等于后 \(n + m - k\) 中任意一个(注:此处默认在 \(a, b\) 的最前面、最后面分别塞一个 \(-\infty, +\infty\),这样可以避免类似 \(x = 0\)\(x = n\) 的这种尴尬的边界情况)。

另外,如果知道了 \(x\),显然也就知道了我们要求的 \(c\) 中第 \(k\) 个数(它就是 \(\max(a_x, b_{k - x})\))。

怎么求 \(x\) 呢?我们先随便猜一个值 \(x'\)。那么:

  • \(x' = x\),根据刚才的讨论,有:\(\max(a_x, b_{k - x}) \leq \min(a_{x + 1}, b_{k - x + 1})\)
  • \(x' < x\),相当于前 \(k\) 个数里来自 \(a\) 的太少了,来自 \(b\) 的太多了,所以 \(a_{x'}\) 太小,而 \(b_{k - x'}\) 太大。应该从后 \(n + m - k\) 个数里把一些来自 \(a\) 的数拿到前面来,替换掉前 \(k\) 个数里来自 \(b\) 的数。因此,此时有:\(b_{k - x'} > a_{x' + 1}\)
  • \(x' > x\),与上一条同理:前 \(k\) 个数里来自 \(a\) 的太多了,来自 \(b\) 的太少了,所以 \(a_{x'}\) 太大,而 \(b_{k - x'}\) 太小。应该从后 \(n + m - k\) 个数里把一些来自 \(b\) 的数拿到前面来,替换掉前 \(k\) 个数里来自 \(a\) 的数。因此,此时有:\(a_{x'} > b_{k - x' + 1}\)

想明白这些以后,我们发现,只要我们随便猜一个 \(x'\),就能 \(\mathcal{O}(1)\) 判断出它是大了还是小了。于是可以二分 \(x'\)。至此,我们在 \(\mathcal{O}(\log(n + m))\) 的时间复杂度内解决了本题。

一个需要注意的细节是,可能的 \(x\) 的范围是 \([0, k] \cap [k - m, n] = [\max(0, k - m), \min(k, n)]\)。二分开始前这样设置好范围,就可以避免下标越界的问题。

参考代码

class Solution {
public:
	const int INF = 1e6 + 5;
	int n, m;
	double find(vector<int>& a, vector<int>& b, int K) {
		int l = max(0, K - m), r = min(n, K);
		// 前 K 个里有多少个来自 a
		while (l <= r) {
			int from_a = (l + r) >> 1; // mid
			int from_b = K - from_a;
			
			assert(from_b >= 0);
			assert(from_b <= m);
			
			int la, lb, ra, rb;
			if (from_a == 0) la = -INF;
			else la = a[from_a - 1];
			if (from_b == 0) lb = -INF;
			else lb = b[from_b - 1];
			if (from_a == n) ra = INF;
			else ra = a[from_a];
			if (from_b == m) rb = INF;
			else rb = b[from_b];
			
			if (max(la, lb) <= min(ra, rb)) {
				return max(la, lb);
			} else {
				if (la > rb) {
					r = from_a - 1;
				} else {
					assert(lb > ra);
					l = from_a + 1;
				}
			}
		}
		assert(0);
	}
	double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
		n = nums1.size();
		m = nums2.size();
		
		if ((n + m) & 1) {
			return find(nums1, nums2, (n + m) / 2 + 1);
		} else {
			double x = find(nums1, nums2, (n + m) / 2);
			double y = find(nums1, nums2, (n + m) / 2 + 1);
			return (x + y) / 2.0;
		}
	}
};

11. 盛最多水的容器

题目链接

题目大意

给定一个长度为 \(n\) 的数组 \(h\),求 \(\max_{1\leq j< i\leq n}\{(i - j)\cdot \min\{h_i, h_j\}\}\)

数据范围:\(2\leq n\leq 10^5\)\(0\leq h_i\leq 10^4\)


解法

不妨假设左端点的 \(h\) 值大于等于右端点的,即 \(h_j\geq h_i\) (\(j< i\))。然后再把数组翻转,用同样的方法再做一遍,就能涵盖所有情况了。

枚举右端点 \(i\)。我们只考虑 \(i\) 左边的、\(h_j\geq h_i\)\(j\)。显然,在这些 \(j\) 里,最小\(j\) 是最优的(与 \(h_j\) 具体是几无关,因为取 \(\min\) 后对式子产生贡献的是 \(h_i\),而不是 \(h_j\))。

于是,问题转化为:每次给定一个数 \(x\)(其实就是 \(h_i\)),求序列里第一个满足 \(h_j\geq x\) 的数的位置。一个显然的想法是二分,然后用线段树求区间最大值,看是否大于等于 \(x\)。这样做总时间复杂度是 \(\mathcal{O}(n\log^2 n)\)。可以优化为线段树上二分,或者二分后用 RMQ 算法求区间最大值,总时间复杂度 \(\mathcal{O}(n\log n)\)。还有一种更简便的做法:将序列里所有数取出来,按数值从小到大排序,然后将它们依次放回序列中(放到原位置),假设当前放回的数是 \(h_i\),那么我们要求的实际上是数列里的第一个空位置。可以用一个“指针”维护:用 \(\texttt{while}\) 循环,只要位置不为空就把“指针”暴力往右移,这样总移动次数是 \(\mathcal{O}(n)\) 的。时间复杂度 \(\mathcal{O}(n\log n)\),瓶颈是排序。

时间复杂度可以继续优化到线性。我们现在从右向左依次枚举 \(h_i\),考虑如果让 \(j\) 单调不降会怎么样。也就是说,原来我们对 \(j\) 的定义是 \(j = \min\{j \mid h_j \geq h_i\}\)。现在假设 \(i + 1\) 对应的“\(j\)”是 \(j'\),那么我们将 \(j\) 的定义修改为:\(j = \min\{j \mid j\geq j' \text{ and } h_j\geq h_i\}\)。此时我们面临的问题是:如果 \(h_i < h_{i + 1}\),我们可能会漏掉一个 \(j < j'\),它满足 \(h_i\leq h_j < h_{i + 1}\)。但是这样的一组 \((j, i)\) 真的会成为最优答案吗?并不会!因为 \((j, i + 1)\) 必然优于 \((j, i)\),所以这样的 \((j, i)\) 根本不需要考虑。于是,由于 \(j\) 单调不降,最多只会把整个数组扫一遍,总时间复杂度就是 \(\mathcal{O}(n)\) 的了。

参考代码

class Solution {
public:
    int maxArea(vector<int>& height) {
        int n = height.size();
        int ans = 0;
        for (int i = 0, j = n - 1; i < n; ++i) {
            while (height[j] < height[i])
                --j;
            ans = max(ans, (j - i) * height[i]);
            if (i == j)
                break;
        }
        for (int i = n - 1, j = 0; i >= 0; --i) {
            while (height[j] < height[i])
                ++j;
            ans = max(ans, (i - j) * height[i]);
            if (i == j)
                break;
        }
        return ans;
    }
};

41. 缺失的第一个正数

题目链接

题目大意

给你一个长度为 \(n\) 的、未排序的整数数组 \(a\),请你找出其中没有出现的最小的正整数。

请你实现时间复杂度为 \(\mathcal{O}(n)\) 并且只使用常数级别额外空间的解决方案。


一个提示

可以修改原数组。

方法一

首先,一个观察是:答案只可能在 \([1, n + 1]\) 中。比方说,如果答案为 \(n + 2\),那么需要 \(1,2,\dots n + 1\)\(n + 1\) 个数全都出现过,而数组里只有 \(n\) 个数,故答案不可能为 \(n + 2\)

于是可以有一个时间复杂度 \(\mathcal{O}(n)\),但是需要 \(\mathcal{O}(n)\) 额外空间的做法:开一个大小为 \(n\)\(\texttt{bool}\) 型数组 \(b_{1\dots n}\)。对于每个 \(a_i\),若 \(a_i\in [1, n]\),就令 \(b_{a_i} = 1\)。最后从 \(1\)\(n\) 遍历 \(b\),遇到的第一个 \(b_j = 0\) 的位置 \(j\) 就是答案(如果所有 \(b_j\) 都是 \(1\),答案就是 \(n + 1\))。

进一步优化,注意到在上述做法中,所有 \(a_i\notin [1, n]\)\(a_i\),它具体是几,其实不重要。不妨令这些 \(a_i\) 都为 \(0\)。那么 \(a\) 数组里的数值范围就只有 \([0, n]\)。但是,\(a\) 可是一个 \(\texttt{int}\) 类型的数组啊!这岂不是大大的浪费?于是想到,可以用 \(a_i\) 的前 \(19\) 个二进制位来存储原本要存的数(\(2^{19} - 1 = 524287 > n\),足够存储);第 \(20\) 个二进制位,把它当成 \(b_i\) 去使用。前 \(19\) 个二进制位和第 \(20\) 个二进制位互不影响,完全就和开两个数组效果一样。然后沿用之前的做法即可。时间复杂度 \(\mathcal{O}(n)\),额外空间复杂度 \(\mathcal{O}(1)\)

参考代码(方法一)

class Solution {
public:
	int n;
	int firstMissingPositive(vector<int>& nums) {
		n = nums.size();
		
		for (int i = 0; i < n; ++i) {
			if (nums[i] <= 0 || nums[i] > n) {
				nums[i] = 0;
			}
		}
		
		for (int i = 0; i < n; ++i) {
			int x = nums[i] & ((1 << 19) - 1);
			if (x) {
				assert(x <= n);
				nums[x - 1] |= (1 << 19);
			}
		}
		
		for (int i = 1; i <= n; ++i) {
			if ((nums[i - 1] >> 19) == 0) {
				return i;
			}
		}
		
		return n + 1;
	}
};

方法二

我们考虑将 \(a\) 数组“恢复”成下面的形式:

如果数组中包含 \(x \in [1, n]\),那么恢复后,数组的第 \(x\) 个元素为 \(x\)。(此处认为下标从 \(1\) 开始)

形式化地说,设恢复后的数组为 \(a'\)。那么 \(\{a'_i\} = \{a_i\}\)(这里是可重集),并且对于所有 \(x\in[1, n]\)\(\exist i\) 使得 \(a_i = x\)\(x\),有 \(a'_x = x\)

在恢复后,数组应当为 \(1, 2, \dots, n\) 的形式,但其中有若干个位置上的数是错误的,每一个错误的位置就代表了一个缺失的正数。

如何恢复?考虑依次遍历所有位置。假设当前遍历到 \(a_i\)。记 \(a_i = x\)

  • \(x\notin[1, n]\),直接跳过不管,继续遍历。
  • \(x\in [1, n]\),我们需要把它放到 \(a_x\) 的位置上。考虑 \(a_x\) 位置上现在的数。
    • 如果 \(a_x\) 已经等于 \(x\),那么说明数组里原本就有多个 \(x\)\(x\) 已经被恢复好了,而当前的 \(a_i\) 是多余的,我们跳过不管,继续遍历。
    • 如果 \(a_x \neq x\),我们 \(\text{swap}(a_i, a_x)\)。这样就把 \(x\) 放到 \(a_x\) 上了。不过现在 \(a_i\) 上又多了一个新的数。令 \(x\) 等于新的 \(a_i\),我们重复上述操作,直到 \(x\notin[1,n]\) 或者 \(a_x = x\)

因为每次交换都会使得一个数回到正确的位置,而已经回到正确位置上的数不会再移动,所以总交换次数最多为 \(\mathcal{O}(n)\)

时间复杂度 \(\mathcal{O}(n)\),额外空间复杂度 \(\mathcal{O}(1)\)

参考代码(方法二)

class Solution {
public:
	int n;
	int firstMissingPositive(vector<int>& nums) {
		n = nums.size();
		for (int i = 0; i < n; ++i) {
			while (nums[i] >= 1 && nums[i] <= n) {
				int x = nums[i];
				if (nums[x - 1] == x) {
					break;
				}
				swap(nums[x - 1], nums[i]);
			}
		}
		for (int i = 0; i < n; ++i) {
			if (nums[i] != i + 1) {
				return i + 1;
			}
		}
		return n + 1;
	}
};

328. 奇偶链表

题目链接

这题本身很简单,我是想借这题讲一点链表操作中的小技巧。平时在 OI 中我很少使用这种用指针实现的“真正的链表”,所以对它不是很熟悉。

  1. 链表题往往让你返回链表的首元素地址。而你操作完之后手上拿着的往往是最后一个元素的地址。所以在一开始要把首元素地址备份一下。
  2. 要新建节点时,可以选择“把数值填写到当前节点上,再新建一个空白节点”,或者“先新建一个节点,把数值填写到新节点上”。这有点类似于 OI 里输出一个序列时,cout << a[i] << " "; 还是 cout << " " << a[i];。在链表题中,我推荐使用后一种做法。因为无论哪种做法,最后都涉及到多出来一个节点,要删掉,前一种做法多出来的是尾节点,后一种做法多出来的是首节点。要删除首节点是很容易的,令 首节点 = 首节点 -> next 即可;而要删除尾节点就比较麻烦了,因为我们不知道倒数第二个节点是谁,需要用一个 last 记录。

参考代码

/**
 * Definition for singly-linked list.
 * struct ListNode {
 *     int val;
 *     ListNode *next;
 *     ListNode() : val(0), next(nullptr) {}
 *     ListNode(int x) : val(x), next(nullptr) {}
 *     ListNode(int x, ListNode *next) : val(x), next(next) {}
 * };
 */
class Solution {
public:
    ListNode* oddEvenList(ListNode* head) {
		ListNode* a = new ListNode;
		ListNode* b = new ListNode;
		ListNode* heada = a;
		ListNode* headb = b;
		int x = 1;
		while (head != NULL) {
			if (x & 1) {
				a -> next = new ListNode;
				a = a -> next;
				a -> val = head -> val;
			} else {
				b -> next = new ListNode;
				b = b -> next;
				b -> val = head -> val;
			}
			
			head = head -> next;
			++x;
		}
		b -> next = NULL;
		a -> next = headb -> next;
		return heada -> next;
    }
};

2183. 统计可以被 K 整除的下标对数目

题目链接

题目大意

给定一个长度为 \(n\) 的正整数数组 \(a\) 和一个正整数 \(k\)。求有多少对下标 \((i, j)\) 满足 \(1\leq i < j\leq n\)\((a_i\times a_j) \bmod k = 0\)

数据范围:\(1\leq n, k, a_i\leq 10^5\)。(注:实测 \(\mathcal{O}(n\sqrt{n})\) 做法会超时)。


解法

首先,可以令 \(a_i \leftarrow \gcd(a_i, k)\),不会影响答案。

\(b_i = \frac{k}{a_i}\)。问题转化为,对每个 \(i\),求有多少 \(j < i\) 满足 \(a_j\)\(b_i\) 的倍数。

不妨先忽略 \(j < i\) 这个要求(即 \(j\) 可以是 \([1, n]\) 中任意数),设此时求出的答案为 \(\text{ans}'\)。此时,每对合法的下标会被算两次(也就是 \((i, j)\)\((j, i)\)),此外 \((i, i)\) 的情况也会被算到。所以,设真正的答案为 \(\text{ans}\),则 \(\text{ans'} = \text{ans}\cdot 2+\sum_{i = 1}^{n}[a_i^2\bmod k = 0]\)。我们求出 \(\text{ans}'\) 就能推出 \(\text{ans}\)

考虑如何求 \(\text{ans}'\)。因为数值 \(k, a_i\) 的范围不大,我们可以预处理出一个数组 \(g\),满足 \(g_x = \sum_{i = 1}^{n}[a_i\bmod x = 0]\),也就是整个 \(a\) 中有多少数是 \(x\) 的倍数。再枚举 \(i\),每次把 \(g_{b_i}\) 累加到 \(\text{ans}'\) 里即可。

如何预处理 \(g\)?先弄一个数组 \(f\),满足 \(f_y = \sum_{i = 1}^{n}[a_i = y]\),也就是数值 \(y\)\(a\) 中出现了多少次。再对每个 \(x\),暴力枚举 \(x\) 的所有倍数 \(y\),把 \(f_y\) 累加到 \(g_x\) 里。这样做的时间复杂度是 \(\mathcal{O}(\sum_{i = 1}^{n} \frac{n}{i}) = \mathcal{O}(n\log n)\)

其他部分都是线性的,所以整个算法的时间复杂度就是 \(\mathcal{O}(n\log n)\)

参考代码

class Solution {
public:
	typedef long long ll;
	static const int MAXN = 1e5;
	int gcd(int a, int b) {
		return (!b) ? a : gcd(b, a % b);
	}
	int n, f[MAXN + 5], g[MAXN + 5];
	long long coutPairs(vector<int>& a, int K) {
		n = a.size();
		for (int i = 0; i < n; ++i) {
			a[i] = gcd(a[i], K);
			f[a[i]]++;
		}
		for (int i = 1; i <= MAXN; ++i) {
			for (int j = i; j <= MAXN; j += i) {
				g[i] += f[j];
			}
		}
		ll ans = 0;
		for (int i = 0; i < n; ++i) {
			ans += g[K / a[i]];
		}
		for (int i = 0; i < n; ++i) {
			ans -= ((ll)a[i] * a[i] % K == 0);
		}
		assert(ans % 2 == 0);
		ans /= 2;
		return ans;
	}
};

2386. Find the K-Sum of an Array

题目链接

题目大意

给定一个长度为 \(n\) 的数组 \(\text{nums}\) 和一个正整数 \(k\),求 \(\text{nums}\) 中第 \(k\) 大的子序列元素和。

数据范围:\(1\leq n\leq 10^5​\)\(-10^9 \leq \text{nums}_i\leq 10^9​\)\(1\leq k\leq \min(2000, 2^n)​\)


解法

首先,选子序列等价于选子集。因此数组中的元素顺序无关紧要,我们可以将数组随意排序。

数组中可能既有负数,又有正数,这让我们比较头疼。考虑最大的子序列元素和,一定是把所有正数都选上,所有负数都不选。记这个和为 \(\text{base}\)。那么其他所有子序列元素和,都可以看做在 \(\text{base}\) 的基础上做修改。具体来说,要么是在 \(\text{base}\) 的基础上放弃一些正数,即减去一些正数的值,要么是在 \(\text{base}\) 的基础上再选一些负数,即加上一些负数的值。为了把“减正数”和“加负数”统一,我们将数组里所有正数改成它的相反数。那么现在数组里所有元素就都变成了正数,而子序列元素和就可以看做是在 \(\text{base}\) 的基础上,减去数组里一个子集的和。问题转化为,对一个全是正数的数组,求其第 \(k\) 的子集和。

我们考虑用堆来求。当然,总共有 \(2^n​\) 个子集,肯定不能一开始就全放入堆里。在任意时刻,堆里只能存放一部分方案。我们希望在第 \(t​\) (\(1\leq t\leq k​\)) 次弹出堆顶时,弹出的恰好是第 \(t​\) 优的方案(也就是第 \(t​\) 小的子集和)。这本质上是要求,我们要设计出一种入堆的顺序,使得对于每个尚未入堆的方案,堆里至少存在一个比它更优的方案。这样就不会出现,应该弹出第 \(t​\) 优的方案,而第 \(t​\) 优的方案还未被放入堆中的情况。

我们的设计是:先将 \(\text{nums}\) 数组(现在全是正数)从小到大排序。最优的方案肯定是空集,它比较特殊,我们不管它。第二优的方案肯定是只选第一个数,我们将该方案加入堆中。在接下来的 \(k - 1\) 个时刻,我们每次从堆中弹出最优的方案。设该方案子集和为 \(s\)。考虑该方案里所选的,最大的数,设它是 \(\text{nums}_i\)。我们将两种新方案放入堆中:\(s + \text{nums}_{i + 1}\)(也就是选上第 \(i + 1\) 个数)和 \(s - \text{nums}_i + \text{nums}_{i + 1}\)(也就是把第 \(i\) 个数换成第 \(i + 1\) 个数)。为什么这样是对的?因为在集合里其他元素不变的情况下,选 \(\text{nums}_i\) 一定比选 \(\text{nums}_{i + 1}\) 更优,所以在 \(s - \text{nums}_i + \text{nums}_{i + 1}\) 加入之前,堆里一直存在 \(s\) 或比 \(s\) 更优的方案。此外,每个集合都会被考虑到,因为任意一个集合,都能唯一确定它是被谁生成的(也就是去掉最大元素,加上最大元素上一个元素),如此一直往前推,必定能推到最开始的集合。

综上所述,在具体实现中,我们对每个方案,只需要记录它的元素和,以及最大的元素的下标。也就是在堆里存一个 \(\texttt{pair}​\) 即可。

因为堆操作只会进行 \(k\) 轮,每轮弹出一个元素,加入两个元素,堆里的元素数量是 \(\mathcal{O}(k)\) 的,所以每轮操作的时间复杂度是 \(\mathcal{O}(\log k)\),整个过程的时间复杂度为 \(\mathcal{O}(k\log k)\)。因为一开始还要给 \(n\) 个数排序,所以总时间复杂度是 \(\mathcal{O}(n\log n + k\log k)\)

参考代码

class Solution {
public:
    long long kSum(vector<int>& nums, int k) {
        long long base = 0;
        for (int i = 0; i < (int)nums.size(); ++i) {
            if (nums[i] > 0) {
                base += nums[i];
            } else {
                nums[i] = -nums[i];
            }
        }
        
        sort(nums.begin(), nums.end());
        
        long long res = 0;
        typedef pair<long long, int> PR;
        priority_queue<PR, vector<PR>, greater<PR> > que; // 小根堆
        que.push(make_pair(nums[0], 0));
        for (int t = 0; t < k - 1; ++t) {
            long long s = que.top().first;
            int i = que.top().second;
            que.pop();
            
            if (i + 1 < (int)nums.size()) {
                que.push(make_pair(s + nums[i + 1], i + 1));
                que.push(make_pair(s - nums[i] + nums[i + 1], i + 1));
            }
            
            res = s;
        }
        return base - res;
    }
};

2289. Steps to Make Array Non-decreasing

题目链接

题目大意

给定一个长度为 \(n\) 的数组 \(a\)(下标为 \(0\dots n - 1\))。每次操作,我们会同时删去所有满足如下条件的元素:

  • \(0 < i < n\)\(a_{i - 1} > a_i\)

注意,每次操作都是先找出所有要删的元素,再同时删去,而不是判定一个删去一个。

我们将一直进行操作,直到数组单调不下降(即,\(\forall i > 0: a_{i - 1} \leq a_i\))。求操作次数。

数据范围:\(1\leq n\leq 10^5\)\(1\leq a_i\leq 10^9\)


解法

注:本题我的做法不是最优做法,比较麻烦。官网讨论区有更简单的做法。

\(f_i\) 表示原数组里位置 \(i\) 上的元素,会在第几次操作中被删去。特别地,如果它永远不会被删去,则 \(f_i = \infty\)。显然,答案就是 \(\max \{f_i \ | \ f_i\neq \infty\}\)

注意到一个性质,一个元素的 \(f_i\),只与它前面的元素有关。所以可以从左到右,依次求 \(f_i\)。也就是在访问到 \(i\) 时,可以假设所有 \(0\leq j < i\)\(f_j\) 已知。

如果元素 \(i​\) 在被删去时,它前面那个比它大的元素,在原数组里位置为 \(j​\),我们就称 \(j​\)\(i​\) 吃掉了。如果知道了 \(i​\) 是被 \(j​\) 吃掉的,那么 \(f_i = \max \{f_k + 1 \ |\ j < k < i\}​\)。问题转化为求每个元素是被谁吃掉的。

发现 \(j\) 要吃掉 \(i\) (\(j < i\)),必须满足如下两个性质:

  1. \(a_j > a_i\)
  2. \(f_j \geq \max\{f_k + 1 \ |\ j < k < i\}\)。也就是说,\(j\) 不能在遇到 \(i​\) 前自己先被吃掉。

我们发现,\(i\) 一定会被满足这两个条件的,最大的 \(j\) 吃掉。如果 \(i\) 前面没有满足这两个条件的 \(j\),那么 \(f_i = \infty\)

考虑如何求出满足这两个条件的,最大的 \(j\)。先考虑第一个条件。将 \(a\) 数组离散化。然后在值域上建立线段树。线段树每个叶子节点 \(p\)\(a_i = p\) 的最大的 \(i\),用线段树维护区间最大值。这样,每次查询区间 \([a_i + 1, \text{maxValue}]\) 里的最大值,就是我们想要的 \(j\)。对于第二个条件,我们发现因为我们是从左到右考虑所有 \(i\) 的,如果一个 \(j\) 在某一个 \(i\) 那里不满足第二个条件,在后面的所有 \(i\) 里也一定都不满足。所以只需要每次把不满足第二个条件的 \(j\) 全部删去(即在线段树上给 \(a_j\) 赋值为 \(-\infty\))即可。可以用小根堆来维护,每次弹出 \(f_j\) 最小的 \(j\),看是否满足第二个条件。

我们已经求出每个 \(i\) 对应的 \(j\)。接下来只需要查询 \([j + 1, i - 1]\) 区间里 \(f_k\) 的最大值即可。可以再用另一棵线段树维护 \(f\) 数组,操作和前面一样,都是需要支持单点修改、查询区间最大值。

时间复杂度 \(\mathcal{O}(n\log n)\)

参考代码

class Solution {
public:
    static const int INF = 1e9;

    struct SegmentTree {
        vector<int> mx;
        void init(int n) {
            mx.resize(n * 4 + 5);
        }

        void push_up(int p) {
            mx[p] = max(mx[p << 1], mx[p << 1 | 1]);
        }
        void build(int p, int l, int r) {
            if (l == r) {
                mx[p] = -INF;
                return;
            }
            int mid = (l + r) >> 1;
            build(p << 1, l, mid);
            build(p << 1 | 1, mid + 1, r);
            push_up(p);
        }
        void modify(int p, int l, int r, int pos, int val) {
            if (l == r) {
                mx[p] = val;
                return;
            }
            int mid = (l + r) >> 1;
            if (pos <= mid) {
                modify(p << 1, l, mid, pos, val);
            } else {
                modify(p << 1 | 1, mid + 1, r, pos, val);
            }
            push_up(p);
        }
        int query(int p, int l, int r, int ql, int qr) {
            if (ql <= l && qr >= r) {
                return mx[p];
            }
            int mid = (l + r) >> 1;
            int res = -INF;
            if (ql <= mid) {
                res = query(p << 1, l, mid, ql, qr);
            }
            if (qr > mid) {
                res = max(res, query(p << 1 | 1, mid + 1, r, ql, qr));
            }
            return res;
        }
        SegmentTree() {}
    } Tj, Tf;

    int totalSteps(vector<int>& a) {
        int n = a.size();

        // discretization
        vector<int> vals;
        for (int i = 0; i < n; ++i) {
            vals.push_back(a[i]);
        }
        sort(vals.begin(), vals.end());
        vals.erase(unique(vals.begin(), vals.end()), vals.end());
        for (int i = 0; i < n; ++i) {
            a[i] = lower_bound(vals.begin(), vals.end(), a[i]) - vals.begin();
        }

        int m = vals.size();
        Tj.init(m);
        Tj.build(1, 0, m - 1);

        Tf.init(n);
        Tf.build(1, 0, n - 1);

        vector<int> f(n);
        int ans = 0;
        priority_queue<pair<int, int>, vector<pair<int, int> >, greater<pair<int, int> > > pque; // min heap
        for (int i = 0; i < n; ++i) {
            int killer = -INF;
            if (a[i] != m - 1) {
                killer = Tj.query(1, 0, m - 1, a[i] + 1, m - 1);
            }

            if (killer == -INF) {
                f[i] = INF;
            } else {
                if (killer + 1 <= i - 1) {
                    f[i] = Tf.query(1, 0, n - 1, killer + 1, i - 1) + 1;
                } else {
                    assert(killer == i - 1);
                    f[i] = 1;
                }
                ans = max(ans, f[i]);
            }
            // cout << f[i] << " ";

            while (!pque.empty() && pque.top().first < f[i] + 1) {
                int j = pque.top().second;
                Tj.modify(1, 0, m - 1, a[j], -INF);
                pque.pop();
            }

            pque.push(make_pair(f[i], i));
            Tj.modify(1, 0, m - 1, a[i], i);
            Tf.modify(1, 0, n - 1, i, f[i]);
        }
        // cout << endl;
        return ans;
    }
};
posted @ 2022-01-26 22:58  duyiblue  阅读(399)  评论(3编辑  收藏  举报