特殊数据结构:单调栈
引言
栈(stack)是很简单的一种数据结构,先进后出的逻辑顺序,符合某些问题的特点,比如说函数调用栈。
单调栈实际上就是栈,只是利用了一些巧妙的逻辑,使得每次新元素入栈后,栈内的元素都保持有序(单调递增或单调递减)。
用简洁的话来说就是:单调栈就是 栈内元素单调递增或者单调递减
的栈,单调栈只能在栈顶操作。
听起来有点像堆(heap)
?不是的,单调栈用途不太广泛,只处理一种典型的问题,叫做 Next Greater Element
。本文用讲解单调队列的算法模版解决这类问题,并且探讨处理「循环数组」的策略。
介绍
首先,讲解 Next Greater Number
的原始问题:给你一个数组,返回一个等长的数组,对应索引存储着下一个更大元素,如果没有更大的元素,就存 -1。不好用语言解释清楚,直接上一个例子:
给你一个数组$ [2,1,2,4,3]$,你返回数组 \([4,2,4,-1,-1]\)。
解释:第一个 2 后面比 2 大的数是 4; 1 后面比 1 大的数是 2;第二个 2 后面比 2 大的数是 4; 4 后面没有比 4 大的数,填 -1;3 后面没有比 3 大的数,填 -1。
这道题的暴力解法很好想到,就是对每个元素后面都进行扫描,找到第一个更大的元素就行了。但是暴力解法的时间复杂度是$ O(n^2)$。
这个问题可以这样抽象思考:把数组的元素想象成并列站立的人,元素大小想象成人的身高。这些人面对你站成一列,如何求元素「2」的 Next Greater Number 呢?很简单,如果能够看到元素「2」,那么他后面可见的第一个人就是「2」的 Next Greater Number,因为比「2」小的元素身高不够,都被「2」挡住了,第一个露出来的就是答案。
这个情景很好理解吧?带着这个抽象的情景,先来看下代码。
vector<int> nextGreaterElement(vector<int>& nums) {
vector<int> ans(nums.size()); // 存放答案的数组
stack<int> s;
for (int i = nums.size() - 1; i >= 0; i--) { // 倒着往栈里放
while (!s.empty() && s.top() <= nums[i]) { // 判定个子高矮
s.pop(); // 矮个起开,反正也被挡着了。。。
}
ans[i] = s.empty() ? -1 : s.top(); // 这个元素身后的第一个高个
s.push(nums[i]); // 进队,接受之后的身高判定吧!
}
return ans;
}
另外这里有洛谷模板题
模板AC代码
#include <bits/stdc++.h>
using namespace std;
int main() {
ios::sync_with_stdio(false), cin.tie(0);
int n;
cin >> n;
vector<int> V(n + 1), ans(n + 1);
for (int i = 1; i <= n; ++i) cin >> V[i];
stack<int> S;
for (int i = 1; i <= n; ++i) {
while (!S.empty() && V[S.top()] < V[i]) {
ans[S.top()] = i;
S.pop();
}
S.push(i);
}
for (int i = 1; i <= n; ++i) cout << ans[i] << " ";
return 0;
}
这就是单调队列解决问题的模板。for 循环要从后往前扫描元素,因为我们借助的是栈的结构,倒着入栈,其实是正着出栈。while 循环是把两个“高个”元素之间的元素排除,因为他们的存在没有意义,前面挡着个“更高”的元素,所以他们不可能被作为后续进来的元素的 Next Great Number 了。
这个算法的时间复杂度不是那么直观,如果你看到 for 循环嵌套 while 循环,可能认为这个算法的复杂度也是 O(n^2),但是实际上这个算法的复杂度只有 O(n)。
分析它的时间复杂度,要从整体来看:总共有 n 个元素,每个元素都被 push 入栈了一次,而最多会被 pop 一次,没有任何冗余操作。所以总的计算规模是和元素规模 n 成正比的,也就是 O(n) 的复杂度。
现在,你已经掌握了单调栈的使用技巧,来一个简单的变形来加深一下理解。
给你一个数组 T = [73, 74, 75, 71, 69, 72, 76, 73],这个数组存放的是近几天的天气气温(这气温是铁板烧?不是的,这里用的华氏度)。你返回一个数组,计算:对于每一天,你还要至少等多少天才能等到一个更暖和的气温;如果等不到那一天,填 0 。
举例:给你 T = [73, 74, 75, 71, 69, 72, 76, 73],你返回 [1, 1, 4, 2, 1, 1, 0, 0]。
解释:第一天 73 华氏度,第二天 74 华氏度,比 73 大,所以对于第一天,只要等一天就能等到一个更暖和的气温。后面的同理。
你已经对 Next Greater Number 类型问题有些敏感了,这个问题本质上也是找 Next Greater Number,只不过现在不是问你 Next Greater Number 是多少,而是问你当前距离 Next Greater Number 的距离而已。
相同类型的问题,相同的思路,直接调用单调栈的算法模板,稍作改动就可以啦,直接上代码把。
vector<int> dailyTemperatures(vector<int>& T) {
vector<int> ans(T.size());
stack<int> s; // 这里放元素索引,而不是元素
for (int i = T.size() - 1; i >= 0; i--) {
while (!s.empty() && T[s.top()] <= T[i]) {
s.pop();
}
ans[i] = s.empty() ? 0 : (s.top() - i); // 得到索引间距
s.push(i); // 加入索引,而不是元素
}
return ans;
}
单调栈讲解完毕。下面开始另一个重点:如何处理「循环数组」。
同样是 Next Greater Number,现在假设给你的数组是个环形的,如何处理?
给你一个数组 [2,1,2,4,3],你返回数组 [4,2,4,-1,4]。拥有了环形属性,最后一个元素 3 绕了一圈后找到了比自己大的元素 4 。
首先,计算机的内存都是线性的,没有真正意义上的环形数组,但是我们可以模拟出环形数组的效果,一般是通过 %
运算符求模(余数),获得环形特效:
int[] arr = {1,2,3,4,5};
int n = arr.length, index = 0;
while (true) {
print(arr[index % n]);
index++;
}
回到 Next Greater Number 的问题,增加了环形属性后,问题的难点在于:这个 Next 的意义不仅仅是当前元素的右边了,有可能出现在当前元素的左边(如上例)。
明确问题,问题就已经解决了一半了。我们可以考虑这样的思路:将原始数组“翻倍”,就是在后面再接一个原始数组,这样的话,按照之前“比身高”的流程,每个元素不仅可以比较自己右边的元素,而且也可以和左边的元素比较了。
怎么实现呢?你当然可以把这个双倍长度的数组构造出来,然后套用算法模板。但是,我们可以不用构造新数组,而是利用循环数组的技巧来模拟。直接看代码吧:
vector<int> nextGreaterElements(vector<int>& nums) {
int n = nums.size();
vector<int> res(n); // 存放结果
stack<int> s;
// 假装这个数组长度翻倍了
for (int i = 2 * n - 1; i >= 0; i--) {
while (!s.empty() && s.top() <= nums[i % n])
s.pop();
res[i % n] = s.empty() ? -1 : s.top();
s.push(nums[i % n]);
}
return res;
}
初步来总结一下单调栈吧,单调栈其实是一个看似原理简单,但是可以变得很难的解法。线性的时间复杂度是其最大的优势,每个数字只进栈并处理一次,而解决问题的核心就在处理这块,当前数字如果破坏了单调性,就会触发处理栈顶元素的操作,而触发数字有时候是解决问题的一部分,比如在 Trapping Rain Water 中作为右边界。有时候仅仅触发作用,比如在 Largest Rectangle in Histogram 中是为了开始处理栈顶元素,如果仅作为触发,可能还需要在数组末尾增加了一个专门用于触发的数字。另外需要注意的是,虽然是递增或递减栈,但里面实际存的数字并不一定是递增或递减的,因为我们可以存坐标,而这些坐标带入数组中才会得到递增或递减的数。所以对于玩数组的题,如果相互之间关联很大,那么就可以考虑考虑单调栈能否解题。
另外,单调栈也可以用于离线解决 RMQ 问题。
我们可以把所有询问按右端点排序,然后每次在序列上从左往右扫描到当前询问的右端点处,并把扫描到的元素插入到单调栈中。这样,每次回答询问时,单调栈中存储的值都是位置 \(\le r\) 的、可能成为答案的决策点,并且这些元素满足单调性质。此时,单调栈上第一个位置 \(\ge l\) 的元素就是当前询问的答案,这个过程可以用二分查找实现。使用单调栈解决 RMQ 问题的时间复杂度为 \(O(q\log q + q\log n)\) ,空间复杂度为 \(O(n)\) 。
参考资料
CSDN:单调栈介绍
博客园:单调栈小结
例题补充(来自知乎的Pecco学长)
Codeforce:1313C2. Skyscrapers (hard version)
这个题属于单调栈优化DP。
首先非常显然,最后形成的一定是一个先单调增、再单调减的序列。那么这题有一个 \(O(n^2)\) 的做法就是枚举最高点算出 \(n\) 个值求最小。这可以解决 \(n <= 1000\) 的 easy version。
那么现在 \(n <= 500000\) 怎么做呢,我们用dpl
表示以某个点为最高点时答案数组的前缀和,dpr
表示以某个点为最高点时答案的后缀和,dp
表示以某个点为最高点时的答案,那么显然dp[i] = dpl[i] + dpr[i] - A[i]
。
怎么算dpl
和dpr
呢。以dpl
为例,当i
为最高点时,我们从这个点往左走,如果遇到比A[i]
大的,那么就必须把这个点削成A[i]
;如果遇到一个小于等于A[i]
的,那么后面的部分都可以沿用以此点为最高点的安排了。也就是说,我们要确定左侧最近的小于等于A[i]
的点的位置last[i]
,那么有:
而左侧最近的小于等于A[i]的点可以用单调栈算出。同理,也用单调栈,我们可以对每个i
算出右侧最近的小于等于A[i]
的点next[i]
,那么有:
这就 \(O(n)\) 地解决了这个动态规划问题。
([洛谷P1823 COI2007] Patrik 音乐会的等待)
此题体现了单调栈的另一种重要应用,即解决某些涉及到“两元素间所有元素均(不)大/小于这两者”的问题。
在本题中,我们用一个单调栈存储那些“可以看到当前位置的人的人的编号”,它无疑是单调不增的。每当遍历到一个新的位置时,就计算当前位置的人可以看到前面的多少人,并更新单调栈。由于这道题有身高相等的情况,所以需要合并相同身高的人(可以用pair
),具体可以参考代码:
#include <bits/stdc++.h>
using namespace std;
using ll = long long;
int main() {
ios::sync_with_stdio(false), cin.tie(0);
int n;
cin >> n;
ll ans = 0;
vector<int> V(n);
for (auto &e : V) cin >> e;
stack<pair<int, int>> S; // 这里pair的第二个成员表示相同元素的数量
for (auto e : V) {
int cnt = 0;
while (!S.empty() && S.top().first <= e) {
if (S.top().first == e) cnt = S.top().second;
ans += S.top().second;
S.pop();
}
if (!S.empty()) ans++;
S.emplace(e, cnt + 1);
}
cout << ans << endl;
return 0;
}
Codeforce:1470D. Discrete Centrifugal Jumps
这个题跟上面那个很类似,同样是有关“两元素间所有元素均(不)大/小于这两者”的问题。
设 \(dp[i] = \underset{j \to i}{max}\ dp[i] + 1\) ,其中 \({j \to i}\) 表示 \(j\) 号位置可以跳到 \(i\) 号位置。而具体哪些点可以跳到当前点,可以简单地用两个单调栈进行维护。在这道题中,对于相等的点,我们可以直接用后面的覆盖前面的——因为在一系列连续相等点中,只有最后一个能跳到更远处。
#include <bits/stdc++.h>
using namespace std;
const int INF = numeric_limits<int>::max();
int main() {
ios::sync_with_stdio(false);
int n;
cin >> n;
vector<int> V(n), dp(n, INF);
for (auto &e : V) cin >> e;
dp[0] = 0;
stack<int> S1, S2;
for (int i = 0; i < n; ++i) {
while (!S1.empty() && V[S1.top()] < V[i]) {
dp[i] = min(dp[i], dp[S1.top()] + 1);
S1.pop();
}
if (!S1.empty()) dp[i] = min(dp[i], dp[S1.top()] + 1);
if (!S1.empty() && V[S1.top()] == V[i])
S1.top() = i;
else
S1.push(i);
while (!S2.empty() && V[S2.top()] > V[i]) {
dp[i] = min(dp[i], dp[S2.top()] + 1);
S2.pop();
}
if (!S2.empty()) dp[i] = min(dp[i], dp[S2.top()] + 1);
if (!S2.empty() && V[S2.top()] == V[i])
S2.top() = i;
else
S2.push(i);
}
cout << dp[n - 1];
return 0;
}