队列优化和斜率优化的dp
可以用队列优化或斜率优化的dp这一类的问题为 1D/1D一类问题
即状态数是O(n),决策数也是O(n)
单调队列优化
我们来看这样一个问题:一个含有n项的数列(n<=2000000),求出每一项前面的第m个数到它这个区间内的最小值
可以使用RMQ求区间最小值,那么时间复杂度是O(nlogn),不是让人很满意。
dp[i]为i-m+1->i这个区间的最小值。
那么状态转移方程是
可以看出,这个题目的状态数是O(n),决策数是O(m),且决策的区间是连续的,那么可以尝试想办法把O(m)优化成O(1)
我们可以用单调队列维护一个数据结构,这个数据结构有两个域,pos和val,pos代表下标,val代表该下标所对应的值。队列中的pos单调递增,且val也单调递增
那么当计算一个状态时,只要从队首不断弹出pos<i-m+1的数据,只要pos>=i-m+1,那么该决策就是最优的,因为队列是单调的啊。
同理,同队尾插入一个数据时,只要不断剔除val比a[i]大的数据,直到遇到小于它的,然后将该数据插入队尾。
每个数据只入队列,出队列一次,所以时间复杂度是O(n),
分析:为什么插入的时候,比a[i]大的数据可以剔除,因为j<i时,a[j] > a[i], 那么以后所有的决策中,a[i]都比a[j]更优
为什么可以不断删除pos<i-m+1的数据,因为i是递增的,该数据对当前的i没用,那么对以后的i也是没用的。
1 #include <stdio.h> 2 #include <string.h> 3 #include <stdlib.h> 4 #include <algorithm> 5 #include <iostream> 6 #include <queue> 7 #include <stack> 8 #include <vector> 9 #include <map> 10 #include <set> 11 #include <string> 12 #include <math.h> 13 using namespace std; 14 #pragma warning(disable:4996) 15 #pragma comment(linker, "/STACK:1024000000,1024000000") 16 typedef long long LL; 17 const int INF = 1<<30; 18 /* 19 */ 20 const int N = 100 + 10; 21 int a[N]; 22 int dp[N]; 23 int q[N], head, tail; 24 int main() 25 { 26 int n, m; 27 while (scanf("%d%d", &n,&m) != EOF) 28 { 29 for (int i = 1; i <= n; ++i) 30 scanf("%d", &a[i]); 31 head = tail = 0; 32 q[tail++] = 1; 33 dp[1] = a[1]; 34 for (int i = 2; i <= n; ++i) 35 { 36 while (head < tail && a[i] < a[q[tail - 1]])//插入新的元素,要使得队列依旧单调递增 37 tail--; 38 q[tail++] = i; 39 while (head < tail && q[head] < i - m + 1)//剔除不合要求的pos 40 head++; 41 dp[i] = a[q[head]]; 42 } 43 for (int i = 1; i <= n; ++i) 44 printf("%d ", dp[i]); 45 puts(""); 46 /* 47 5 3 48 1 2 3 4 5 49 1 1 1 2 3 50 */ 51 } 52 return 0; 53 }
那么我们可以抽象出一类模型
需要注意到,上面要求可选的决策集是连续的。同时也可以注意到,当前决策所需要的值是不受现在的状态所影响的,即g(i)与w[x]是相互独立的。
斜率优化
我们在单调队列的最后说道,当前决策所需要的值是不受现在的状态所影响的,即g(i)与w[x]是相互独立的。
还有的1D/1D一类问题是想下面这样的。
但是如果状态转移方程是这样的: dp[i]=dp[j]+(x[i]-x[j])*(x[i]-x[j]) ,1<=j<=i 把括号化开后,得到2x[i]*x[j], 这使得当前决策所需要的值受当前状态的影响
所以上面单调队列的方法就不行了。
题目有n个字符要打印,连续打印k个字符的代价是(c1+c2+...+ck)^2 + m, m是题目所给的常量
题目要优化的是,如果连续打印过多,那么代价平方之后就会很大,如果连续打印过少,那么就多加几次m。
dp[i]表示打印第i个字符时的最小花费
dp[i] = min(dp[i],dp[j] + (sum[i]-sum[j])^2+m) 1<=j<i
那么复杂度是O(n^2),是无法接受的。
那么就需要优化了,
当j > k 且j比k优的时候
dp[j] + (sum[i]-sum[j])^2 + m < dp[k] + (sum[i]-sum[k])^2+m
化简得(dp[j]+sum[j]^2 - (dp[k]+sum[k])^2 )/ (2sum[j]-2sum[k]) < sum[i]
这就很像斜率表达式了,而且这个斜率表达式小于另一个斜率,即sum[i]。
从下图我们可以看出,当j为k优时,斜率为sum[i]的斜线过j点与y轴的截距更小。
令g[j,k]表示上面的式子
当k<j<i时,且g[i,j] <= g[j,k]时,j是可舍弃的。
如果所示,假设j成为最优,那么必须有sum[i] > g[j,k], 且 sum[i] < g[i,j], 即 g[j,k] < sum[i] < g[i,j], 也即有g[i,j] > g[j,k],但是与前提条件g[i,j] <= g[j,k]矛盾,所以假设不成立,所以j是可以舍弃的。
所以,我们要维护一个下凸的图形(即斜率不断增大),因为横坐标(也就是sum[j])是递增的,所以用一个队列维护就行了。如果横坐标不递增的话,就要用平衡树了。
如果,是一个下凸包,我们只要判断sum[i]所代表的斜线与哪个点在y轴上的截距最小就行了,又因为sum[i]是递增的,所以前面判断过的点不用再次判断。
1 #include <stdio.h> 2 #include <string.h> 3 #include <stdlib.h> 4 #include <algorithm> 5 #include <iostream> 6 #include <queue> 7 #include <stack> 8 #include <vector> 9 #include <map> 10 #include <set> 11 #include <string> 12 #include <math.h> 13 using namespace std; 14 #pragma warning(disable:4996) 15 #pragma comment(linker, "/STACK:1024000000,1024000000") 16 typedef long long LL; 17 const int INF = 1<<30; 18 /* 19 普通的dp需要遍历以前的所有值, 20 斜率dp就是通过舍弃一些值,必须是当前可舍弃,以后也是可舍弃的值,从而减少遍历量 21 或者是使得队首的元素就是最优的, 22 23 24 关键是如何判断可舍弃,。。。。。通过数学分析斜率来舍弃??? 25 26 27 28 第i个字符肯定接在前面j个字符的后面,或者另起一行,但是费用该怎么算呢 29 dp[i][1]表示1另起一行 ,那么费用是 dp[i][1] = ci^2 + m + min(dp[i-1][0],dp[i-1][1]) 30 dp[i][0] 表示接在前面j个字符的后面的最小费用 sum{cost[j]}^2+m + min(dp[j-1][0],dp[j-1][1]) 31 32 */ 33 34 const int N = 500000 + 10; 35 int sum[N]; 36 int dp[N]; 37 int q[N], head, tail; 38 int getUp(int i, int j) 39 { 40 return dp[i] + sum[i] * sum[i] - (dp[j] + sum[j] * sum[j]); 41 } 42 int getDown(int i, int j) 43 { 44 return 2 * sum[i] - 2 * sum[j]; 45 } 46 int main() 47 { 48 int n, m; 49 while (scanf("%d%d", &n, &m) != EOF) 50 { 51 for (int i = 1; i <= n; ++i) 52 { 53 scanf("%d", &sum[i]); 54 sum[i] += sum[i - 1]; 55 } 56 head = tail = 0; 57 q[tail++] = 0; 58 for (int i = 1; i <= n; ++i) 59 { 60 /* 61 62 */ 63 while (head + 1 < tail && getUp(q[head + 1], q[head]) <= sum[i] * getDown(q[head + 1], q[head ])) 64 head++; 65 dp[i] = (sum[i] - sum[q[head]]) * (sum[i] - sum[q[head]]) + m + dp[q[head]]; 66 while (head + 1 < tail && getUp(i, q[tail - 1])*getDown(q[tail - 1], q[tail - 2]) <= getUp(q[tail - 1], q[tail - 2])*getDown(i, q[tail - 1])) 67 tail--; 68 q[tail++] = i; 69 } 70 printf("%d\n", dp[n]); 71 } 72 return 0; 73 }
总结,
当横坐标递增,斜率递增时,用队列维护,可以在O(1)的时间内找到最优值,就是上面的情况。
当横坐标递增,斜率不递增时,我们可以二分,因为凸包的斜率是递增的,所以可以二分。
当横坐标不递增时,用平衡树维护。
【参考文献】
《1D1D动态规划优化初步》 作者:南京师范大学附属中学 汪一宁
《用单调性优化动态规划》 JSOI2009集训队论文