RMQ问题+ST算法
一、相关定义
RMQ问题
- 求给定区间的最值;
- 一般题目给定许多询问区间。
常见问题:对于长度为n的数列A,回答若干询问RMQ(A,i,j)(i,j<=n),返回数列A中下标在i,j之间的最小/大值。
解决方法
- 暴力搜索 O(n)-O(n)
- 线段树 O(n)-O(q*logn)
- ST算法 O(n*logn)-O(1)
二、ST(Sparse Table)算法
本节介绍了一种比较高效的在线算法(ST算法)解决RMQ问题。
ST算法
- 是一个非常有名的在线处理RMQ问题的算法;
- 基于DP和位运算符;
- 主要过程为:预处理+查询;
- 时间复杂度:在O(nlogn)时间内进行预处理,然后在O(1)时间内回答每个查询。
数据说明:
- dp[i][j] 表示从第i位开始,到第i+2j-1位的最大/小值;(即从第i个数起连续2j个数中的最大/小值)
求dp[i][j]的时候,可以把它分成两部分,第一部分从 i 到 i+2j-1-1,第二部分从 i+2j-1 到 i + 2j - 1 。显然二进制数后一个是前一个的两倍,那么可以把区间[i,i+2j] 通过2j-1分成相等的两部分(2j个数,则一定可以二等分),dp[i][j]就是这两段各自最大值中的最大值。 那么转移方程很容易就写出来了。
- mm[i][j] = max( mm[ i ][ j - 1] , mm[ i + (1 << ( j - 1))][ j - 1] )
DP三要素:
- 初始值:dp[i][0] = A[i]
- 状态:dp[i][j] 表示从第i位开始,到第i+2j-1位的最大/小值;
- 状态转移方程:mm[i][j] = max( mm[ i ][ j - 1] , mm[ i + (1 << ( j - 1))][ j - 1] )
三、算法模板
【预处理】——DP(动态规划)
模板代码(以求最大值为例):
void rmq_init(int n) { for(int i=1;i<=n;i++) mm[i][0]=mi[i][0]=a[i]; for(int j=1;(1<<j)<=n;j++) //注意循环的顺序,外层是j,内层是i { for(int i=1;i+(1<<j)-1<=n;i++) { mm[i][j]=max(mm[i][j-1],mm[i+(1<<(j-1))][j-1]); } } }
这里我们需要注意的是循环的顺序,我们发现外层是j,内层是i,这是为什么呢?可以是i在外,j在内吗?
答案是不可以。因为我们需要理解这个状态转移方程的意义。不懂,请点击。
【查询】——O(1)
查询的时候对于任意一个区间 l -- r ,我们同样可以得到区间长度 len = (r - l + 1)。
那么我们这里用满足不等式“2k<=len”的 k 把区间分成可以交叉的两部分:①[l,l+2k-1];②[r -2k+1,r] 。
例子:查询5,6,7,8,9,我们可以查询5678和6789)。
因为这个区间的长度为 r - l + 1,所以我们可以取k=log2( r - l + 1),则有:RMQ(A, l, r)=max{mm[l , k], mm[ r - 2k + 1, k]}。
举例说明,要求区间[2,8]的最大值,k = log2(8 - 2 + 1)= 2,即求max(F[2, 2] , F[8 - 22 + 1, 2]) = max(F[2, 2] , F[5, 2]);
在这里我们也需要注意一个地方,就是<<运算符比+/-运算符的优先级低。
代码:
int rmq(int l,int r) { int k=0; while((1<<(k+1))<=r-l+1) k++; //printf("%d %d %d %d\n",l,l+(1<<k),r-(1<<k)+1,r-(1<<k)+1+(1<<k)); int ans1=max(mm[l][k],mm[r-(1<<k)+1][k]); int ans2=min(mm[l][k],mm[r-(1<<k)+1][k]); return ans1-ans2; //返回区间最大值与最小值的差 }
四、沙场练兵
题目:士兵杀敌(三)
代码:
#include<cstdio> #include<algorithm> #include<cmath> using namespace std; const int N = 100010; int maxsum[N][20], minsum[N][20]; void RMQ(int num) //预处理->O(nlogn) { for(int j = 1; j < 20; ++j) for(int i = 1; i <= num; ++i) if(i + (1 << j) - 1 <= num) { maxsum[i][j] = max(maxsum[i][j - 1], maxsum[i + (1 << (j - 1))][j - 1]); minsum[i][j] = min(minsum[i][j - 1], minsum[i + (1 << (j - 1))][j - 1]); } } int main() { int num, query; int src, des; scanf("%d %d", &num, &query); for(int i = 1; i <= num; ++i) //输入信息处理 { scanf("%d", &maxsum[i][0]); minsum[i][0] = maxsum[i][0]; } RMQ(num); while(query--) //O(1)查询 { scanf("%d %d", &src, &des); int k = (int)(log(des - src + 1.0) / log(2.0)); int maxres = max(maxsum[src][k], maxsum[des - (1 << k) + 1][k]); int minres = min(minsum[src][k], minsum[des - (1 << k) + 1][k]); printf("%d\n", maxres - minres); } return 0; }
优化后代码:
#include<cstdio> #include<algorithm> #include<cmath> using namespace std; const int N = 100010; int maxsum[20][N], minsum[20][N]; //优化1 void RMQ(int num) //预处理->O(nlogn) { for(int i = 1; i != 20; ++i) for(int j = 1; j <= num; ++j) if(j + (1 << i) - 1 <= num) { maxsum[i][j] = max(maxsum[i - 1][j], maxsum[i - 1][j + (1 << i >> 1)]); //优化2 minsum[i][j] = min(minsum[i - 1][j], minsum[i - 1][j + (1 << i >> 1)]); } } int main() { int num, query; int src, des; scanf("%d %d", &num, &query); for(int i = 1; i <= num; ++i) //输入信息处理 { scanf("%d", &maxsum[0][i]); minsum[0][i] = maxsum[0][i]; } RMQ(num); while(query--) //O(1)查询 { scanf("%d %d", &src, &des); int k = (int)(log(des - src + 1.0) / log(2.0)); int maxres = max(maxsum[k][src], maxsum[k][des - (1 << k) + 1]); int minres = min(minsum[k][src], minsum[k][des - (1 << k) + 1]); printf("%d\n", maxres - minres); } return 0; }
优化1:数组由F[N][20]变为F[20][N]
因为数组的地址为a + i + j,对应上面数组,我们需要先循环N的部分,所以
如果是第一种,我们计算时因为i不断变化,我们就需要计算a + i + j
如果是第二种,我们计算时a + i不变,只需要改变j
优化2:位运算