队列优化和斜率优化的dp

可以用队列优化或斜率优化的dp这一类的问题为 1D/1D一类问题

即状态数是O(n),决策数也是O(n)

单调队列优化

我们来看这样一个问题:一个含有n项的数列(n<=2000000),求出每一项前面的第m个数到它这个区间内的最小值

可以使用RMQ求区间最小值,那么时间复杂度是O(nlogn),不是让人很满意。

dp[i]为i-m+1->i这个区间的最小值。

那么状态转移方程是

可以看出,这个题目的状态数是O(n),决策数是O(m),且决策的区间是连续的,那么可以尝试想办法把O(m)优化成O(1)

我们可以用单调队列维护一个数据结构,这个数据结构有两个域,pos和val,pos代表下标,val代表该下标所对应的值。队列中的pos单调递增,且val也单调递增

那么当计算一个状态时,只要从队首不断弹出pos<i-m+1的数据,只要pos>=i-m+1,那么该决策就是最优的,因为队列是单调的啊。

同理,同队尾插入一个数据时,只要不断剔除val比a[i]大的数据,直到遇到小于它的,然后将该数据插入队尾。

每个数据只入队列,出队列一次,所以时间复杂度是O(n),

分析:为什么插入的时候,比a[i]大的数据可以剔除,因为j<i时,a[j] > a[i], 那么以后所有的决策中,a[i]都比a[j]更优

  为什么可以不断删除pos<i-m+1的数据,因为i是递增的,该数据对当前的i没用,那么对以后的i也是没用的。

 1 #include <stdio.h>
 2 #include <string.h>
 3 #include <stdlib.h>
 4 #include <algorithm>
 5 #include <iostream>
 6 #include <queue>
 7 #include <stack>
 8 #include <vector>
 9 #include <map>
10 #include <set>
11 #include <string>
12 #include <math.h>
13 using namespace std;
14 #pragma warning(disable:4996)
15 #pragma comment(linker, "/STACK:1024000000,1024000000")
16 typedef long long LL;                   
17 const int INF = 1<<30;
18 /*
19 */
20 const int N = 100 + 10;
21 int a[N];
22 int dp[N];
23 int q[N], head, tail;
24 int main()
25 {
26     int n, m;
27     while (scanf("%d%d", &n,&m) != EOF)
28     {
29         for (int i = 1; i <= n; ++i)
30             scanf("%d", &a[i]);
31         head = tail = 0;
32         q[tail++] = 1;
33         dp[1] = a[1];
34         for (int i = 2; i <= n; ++i)
35         {
36             while (head < tail && a[i] < a[q[tail - 1]])//插入新的元素,要使得队列依旧单调递增
37                 tail--;
38             q[tail++] = i;
39             while (head < tail && q[head] < i - m + 1)//剔除不合要求的pos
40                 head++;
41             dp[i] = a[q[head]];
42         }
43         for (int i = 1; i <= n; ++i)
44             printf("%d ", dp[i]);
45         puts("");
46         /*
47         5 3
48         1 2 3 4 5
49         1 1 1 2 3
50         */
51     }
52     return 0;
53 }
View Code

那么我们可以抽象出一类模型

需要注意到,上面要求可选的决策集是连续的。同时也可以注意到,当前决策所需要的值是不受现在的状态所影响的,即g(i)与w[x]是相互独立的。

 

 

斜率优化

我们在单调队列的最后说道,当前决策所需要的值是不受现在的状态所影响的,即g(i)与w[x]是相互独立的。

还有的1D/1D一类问题是想下面这样的。

但是如果状态转移方程是这样的: dp[i]=dp[j]+(x[i]-x[j])*(x[i]-x[j]) ,1<=j<=i   把括号化开后,得到2x[i]*x[j], 这使得当前决策所需要的值受当前状态的影响

所以上面单调队列的方法就不行了。

hdu3507

 题目有n个字符要打印,连续打印k个字符的代价是(c1+c2+...+ck)^2 + m, m是题目所给的常量

题目要优化的是,如果连续打印过多,那么代价平方之后就会很大,如果连续打印过少,那么就多加几次m。

dp[i]表示打印第i个字符时的最小花费

dp[i] = min(dp[i],dp[j] + (sum[i]-sum[j])^2+m)  1<=j<i

 那么复杂度是O(n^2),是无法接受的。

那么就需要优化了,

当j > k 且j比k优的时候

dp[j] + (sum[i]-sum[j])^2 + m < dp[k] + (sum[i]-sum[k])^2+m

化简得(dp[j]+sum[j]^2 - (dp[k]+sum[k])^2 )/ (2sum[j]-2sum[k]) < sum[i]

这就很像斜率表达式了,而且这个斜率表达式小于另一个斜率,即sum[i]。

从下图我们可以看出,当j为k优时,斜率为sum[i]的斜线过j点与y轴的截距更小。

 

令g[j,k]表示上面的式子

当k<j<i时,且g[i,j] <= g[j,k]时,j是可舍弃的。

如果所示,假设j成为最优,那么必须有sum[i] > g[j,k], 且 sum[i] < g[i,j], 即 g[j,k] < sum[i] < g[i,j],  也即有g[i,j] > g[j,k],但是与前提条件g[i,j] <= g[j,k]矛盾,所以假设不成立,所以j是可以舍弃的。

所以,我们要维护一个下凸的图形(即斜率不断增大),因为横坐标(也就是sum[j])是递增的,所以用一个队列维护就行了。如果横坐标不递增的话,就要用平衡树了。

如果,是一个下凸包,我们只要判断sum[i]所代表的斜线与哪个点在y轴上的截距最小就行了,又因为sum[i]是递增的,所以前面判断过的点不用再次判断。

 

 1 #include <stdio.h>
 2 #include <string.h>
 3 #include <stdlib.h>
 4 #include <algorithm>
 5 #include <iostream>
 6 #include <queue>
 7 #include <stack>
 8 #include <vector>
 9 #include <map>
10 #include <set>
11 #include <string>
12 #include <math.h>
13 using namespace std;
14 #pragma warning(disable:4996)
15 #pragma comment(linker, "/STACK:1024000000,1024000000")
16 typedef long long LL;                   
17 const int INF = 1<<30;
18 /*
19 普通的dp需要遍历以前的所有值,
20 斜率dp就是通过舍弃一些值,必须是当前可舍弃,以后也是可舍弃的值,从而减少遍历量
21 或者是使得队首的元素就是最优的,
22 
23 
24 关键是如何判断可舍弃,。。。。。通过数学分析斜率来舍弃???
25 
26 
27 
28 第i个字符肯定接在前面j个字符的后面,或者另起一行,但是费用该怎么算呢
29 dp[i][1]表示1另起一行 ,那么费用是 dp[i][1] = ci^2 + m + min(dp[i-1][0],dp[i-1][1])
30 dp[i][0] 表示接在前面j个字符的后面的最小费用    sum{cost[j]}^2+m + min(dp[j-1][0],dp[j-1][1])
31 
32 */
33 
34 const int N = 500000 + 10;
35 int sum[N];
36 int dp[N];
37 int q[N], head, tail;
38 int getUp(int i, int j)
39 {
40     return dp[i] + sum[i] * sum[i] - (dp[j] + sum[j] * sum[j]);
41 }
42 int getDown(int i, int j)
43 {
44     return 2 * sum[i] - 2 * sum[j];
45 }
46 int main()
47 {
48     int n, m;
49     while (scanf("%d%d", &n, &m) != EOF)
50     {
51         for (int i = 1; i <= n; ++i)
52         {
53             scanf("%d", &sum[i]);
54             sum[i] += sum[i - 1];
55         }
56         head = tail = 0;
57         q[tail++] = 0;
58         for (int i = 1; i <= n; ++i)
59         {
60             /*
61         
62             */
63             while (head + 1 < tail && getUp(q[head + 1], q[head]) <= sum[i] * getDown(q[head + 1], q[head ]))
64                 head++;
65             dp[i] = (sum[i] - sum[q[head]]) * (sum[i] - sum[q[head]]) + m + dp[q[head]];
66             while (head + 1 < tail && getUp(i, q[tail - 1])*getDown(q[tail - 1], q[tail - 2]) <= getUp(q[tail - 1], q[tail - 2])*getDown(i, q[tail - 1]))
67                 tail--;
68             q[tail++] = i;
69         }
70         printf("%d\n", dp[n]);
71     }
72     return 0;
73 }
View Code

 

 

总结,

当横坐标递增,斜率递增时,用队列维护,可以在O(1)的时间内找到最优值,就是上面的情况。

当横坐标递增,斜率不递增时,我们可以二分,因为凸包的斜率是递增的,所以可以二分。

当横坐标不递增时,用平衡树维护。

 

【参考文献】

《1D1D动态规划优化初步》 作者:南京师范大学附属中学 汪一宁

《用单调性优化动态规划》   JSOI2009集训队论文

《斜率优化dp》

 

posted @ 2015-08-10 20:56  justPassBy  阅读(410)  评论(0编辑  收藏  举报