DAG上的DP
DAG上的DP
DAG即有向无环图
这里举出两经典的DAG模型,嵌套矩形和硬币问题
嵌套矩形(不固定起点最长路及其字典序)
描述
有n个矩形,每个矩形可以用 (a,b) 来描述,表示长和宽
矩形 X(a,b) 可以嵌套在矩形 Y(c,d) 中,当且仅当 a<c,b<d 或者 b<c,a<d(旋转90度)
例如(1,5)可以嵌套在(6,2)内,但不能嵌套在(3,4)中
你的任务是选出尽可能多的矩形排成一行,使得除最后一个外,每一个矩形都可以嵌套在下一个矩形内
分析
矩形间的“可嵌套”关系是一个典型的二元关系,二元关系可以用图来建模
如果矩形X可以嵌套在Y中,则就从X到Y连一条有向边
这个图是无环的,因为一个矩形无法直接或或间接的嵌套在自己的内部
也即是说这是以一个DAG
因此,我们就是在求DAG上的不固定起点的最长路径
解题
设 d(i) 表示从结点 i 出发的最长路长度
第一步只能走到它的相邻点,那么我们就有:
其中,E为边集,则最终答案是所有的d(i)中的最大值,因此可以用递推或者记忆化搜索计算
第一步,建图,假如用邻接矩阵将矩形间的关系保存在矩阵G中
第二步,编写记忆化搜索程序(调用前先初始化数组为0)
第三步,按字典序输出最佳的方案
假如有这样的 5 个矩形,输入的边长分别是:
宽 | 长 |
---|---|
3 | 5 |
4 | 6 |
2 | 3 |
7 | 4 |
6 | 6 |
建图
先对长和宽来此排序,再按照要求构图, 完成之后,直接记忆化搜索,但由于是不固定起点的,所以不能只从第一个点搜索,而是每个点都要开始搜索
搜索代码:
int dp(int i)
{
int& ans = d[i];//为表项d[i]声明一个引用ans
if(ans > 0)
return ans;
ans = 1;
for(int j=1;j<n;j++)
if(G[i][j])
ans = max(ans,dp(j)+1);
return ans;
}
这里使用了一个技巧:为表项d[i]声明一个引用ans,这样,任何对ans的读写实际上都是在对d[i]进行。当d[i]换成d [i] [j] [k] [l] [m] [n] 这样很长的名字时,该技巧的优势就会很明显
然后我们要考虑如何输出字典序最小的方案
字典序只是消除并列名次的方法,我们最根本的任务还是求出最长路
在把所有的d值计算出来后,选择最大的d[i]所对应的i,而如果有多个i,则选择最小的i,来保证字典序最小
接下来选择 d(i) = d(j) +1 且i, j ∈E 的任何一个j,但是为满足字典序最小,需选择最小的j,代码如下
void print_ans(int i){
printf("%d ", i);//第一次i代表最长路的起点节点,以后均代表从该节点开始的路径
for(int j = 1; j <= n; j++)
if(G[i][j] && d[i] == d[j]+1)// 如果该图满足可嵌套,且d[i] = d[j] +1
{
print_ans(j);
//立即输出从节点j开始的路径
break;
}
}
完整题解代码
#include<stdio.h>
#include<string.h>
#define MAXN 100+1
int n, G[MAXN][MAXN];//存图
int x[MAXN], y[MAXN], d[MAXN];
int dp(int i){
int& ans = d[i];//为表项d[i]声明一个引用ans
if(ans > 0)
return ans;
ans = 1;
for(int j=1;j<=n;j++)
if(G[i][j])
ans = max(ans,dp(j)+1);
return ans;
}
void print_ans(int i){
printf("%d ", i);//第一次i代表最长路的起点节点,以后均代表从该节点开始的路径
for(int j = 1; j <= n; j++)
if(G[i][j] && d[i] == d[j]+1)// 如果该图满足可嵌套,且d[i] = d[j] +1
{
print_ans(j);
//立即输出从节点j开始的路径
break;
}
}
int main()
{
int t, ans, best;
scanf("%d", &n);
for(int i = 1; i <= n; i++){
scanf("%d%d", &x[i], &y[i]);
if(x[i] > y[i]){
t = x[i];
x[i] = y[i];
y[i] = t;
//保证X[]存的是长,Y[]存的是宽
}
}
memset(G, 0, sizeof(G));
for(int i = 1; i <= n; i++)//建图
for(int j = 1; j <= n; j++)
if(x[i] < x[j] && y[i] < y[j])
G[i][j] = 1;//如果第i个矩形的长宽均小于第j个,使图相应的值为1
ans = 0;
for(int i = 1; i <= n; i++)//依次递推所有的的节点
if(dp(i) > ans){
best = i;//best是最小字典序
ans = dp(i);
}
printf("ans=%d\n", ans);//表示最长路长度
print_ans(best);
printf("\n");
return 0 ;
}
硬币问题(固定终点的最长路和最短路)
描述
有 n 种硬币,面值分别为V1, V2······Vn,每种都有无限多
给定非负整数 S ,可以选用多少个硬币,使得面值之和恰好为S?
输出硬币数目的最小值和最大值
分析
看上去和嵌套矩形问题很不一样,但本题的本质也是DAG上的路径问题
将每种面值看作一个节点,设初始状态为S,目标状态为0
若当前在状态 i,每使用一个硬币 j,状态便转移到i - Vj
解题
最长路和最短路的求法是类似的,由于终点固定,d(i) 的确切含义变为从结点i出发到结点0的最长路径长度
int dp(int S)
{
int& ans = d[S];
if(ans >= 0)
return ans;
ans = 0;
for(int i=1;i<=n;i++)
if(S >= V[i])
ans = max(ans,dp(S-V[i])+1);
return ans;
}
回顾一下嵌套矩形的找最长路
int dp(int i)
{
int& ans = d[i];//为表项d[i]声明一个引用ans
if(ans > 0)
return ans;
ans = 1;
for(int j=1;j<n;j++)
if(G[i][j])
ans = max(ans,dp(j)+1);
return ans;
}
由于在本题中,路径长度是可以为0的(S本身可以是0),所以不能再用d=0表示这个d值还没有算过,初始化时也不能再把d全设为0,而要设置为一个负值令初始状态不合法,这里可以用 -1 来表示没有算过,初始化时只需用memset(d,-1,sizeof(d))即可,同时 if(ans>0) 也要改成 if(ans>=0)
但其实,由于结点S不一定真的能到达结点0,所以需要用特殊的d[S]值表示“无法到达”,但在上述代码中,如果S根本无法继续往前走,返回值是0,将被误以为是“已到达终点”的意思
如果把ans初始化为-1呢?但-1代表“还没算过”,所以返回-1相当于放弃了自己的劳动成果
如果把ans初始化为一个很大的整数,从目前来看,它也会被认为是“还没算过”,但至少可以和所有d的初值分开——只需把代码中if(ans>=0)改为if(ans!=-1)即可
int dp(int S)
{
int& ans = d[S];
if(ans != -1)
return ans;
ans = -(1<<30);
for(int i=1;i<=n;i++){
if(S >= V[i])
ans = max(ans,dp(S-V[i])+1);
}
return ans;
}
另一个常用的解决方法是不用特殊值表示“还没算过”,而用另外一个数组 vis[i] 表示状态 i 是否被访问过
int dp(int S)
{
if(vis[S])
return d[S];
vis[S] = -1;
int& ans = d[S];
ans = -(1<<30);
for(int i=1;i<=n;i++)
if(S >= V[i])
ans = max(ans,dp(S-V[i])+1);
return ans;
}
本题要求最小、最大两个值,记忆化搜索就必须写两个,在这种情况下,用递推更加方便(此时需注意递推的顺序)
minv[0] = maxv[0] = 0;
for(int i=1;i<=S;i++){
minv[i] = INF;//minv[i]表示最小值
maxv[i] = -INF;//maxv[i]表示最大值
}
for(int i=1;i<=S;i++){
for(int j=1;j<=n;j++){
if(i >= V[j]){
minv[i] = min(minv[i],minv[i-V[j]]+1);
maxv[i] = max(maxv[i],maxv[i-V[j]]+1);
}
}
}
printf("%d %d\n",minv[S],maxv[S]);
如何输出字典序最小的方案呢?刚刚介绍的方法仍然适用,如下所示:
void print_ans(int* d,int S)
{
for(int i=1; i<=n; i++)
{
if(S>=V[i] && d[S]==d[S-V[i]]+1)
{
printf("%d ",i);
print_ans(d,S-V[i]);
break;
}
}
}
上题打印的是路径上的点,而这里打印的是路径上的边
另外一种常用的打印路径的方法:递推时直接用min_coin[S]记录满足min[S]==min[S-V[i]]+1的最小的i,则打印路径时可以省去print_ans()中的循环,并可以方便地把递归改成迭代 (当然,原来的也可以改成迭代,但不那么自然)具体代码如下
for(int i=1;i<=S;i++){
for(int j=1;j<=n;j++){
if(i >= V[j]){
if(min[i]>min[i-V[j]]+1){
min[i] = min[i-V[j]]+1;
min_coin[i] = j;
}
if(max[i]<max[i-V[j]]+1){
max[i] = max[i-V[j]]+1;
max_coin[i] = j;
}
}
}
}
小结
由于DAG最长 (短)路的特殊性,有两种“对称”的状态定义方式。
-
状态1:设 d(i) 为从 i 出发的最长路,则
-
状态2:设 d(i) 为以 i 结束的最长路,则
如果使用状态2,“硬币问题”就变得和“嵌套矩形问题”几乎一样了 (唯一的区别是“嵌套矩形问题”还需要取所有d (i)的最大值)!我们在上面介绍了比较麻烦的状态1,主要是为了展示一些常见技巧和陷阱,实际比赛中不推荐使用。
使用状态2时,有时还会遇到一个问题:状态转移方程可能不好计算,因为在很多时候,可以方便地枚举从某个结点i出发的所有边 (i , j),却不方便“反着”枚举 (j , i)。特别是在有些题目中,这些边具有明显的实际背景,对应的过程不可逆。这时需要用“刷表法”
什么是“刷表法”呢?传统的递推法可以表示成“对于每个状态 i,计算f (i)”,或者称为“填表法”。这需要对于每个状态 i,找到f (i)依赖的所有状态,在某些情况下并不方便。另一种方法是“对于每个状态i,更新f (i)所影响到的状态”,或者称为“刷表法”。对应到DAG最长路的问题中,就相当于按照拓扑序枚举 i,对于每个 i,枚举边 (i , j),然后更新d[j] = max(d[j],d[i]+1)。注意,一般不把这个式子叫做“状态转移方程”,因为它不是一个可以直接计算d[j]的方程,而只是一个更新公式
提示:传统的递推法可以表示成“对于每个状态 i,计算f (i)”,或者称为“填表法”。这需要对于每个状态 i,找到f (i)依赖的所有状态,在某些时候并不方便。另一种方法是“对于每个状态 i,更新f (i)所影响到的状态”,或者称为“刷表法”,有时比填表法方便。但需要注意的是,只有当每个状态所依赖的状态对它的影响相互独立时才能用刷表法
例题
A - A Spy in the Metro
某城市的地铁是线性的,有n(2≤n≤50)个车站,从左到右编号为1~n
有M1辆列车从第1站开始往右开,还有M2辆列车从第n站开始往左开
在时刻0,Mario从第1站出发,目的是在时刻T(0≤T≤200)会见车站n的一个间谍,在车站等车时容易被抓,所以她决定尽量躲在开动的火车上,让在车站等待的总时间尽量短,列车靠站停车时间忽略不计,且Mario身手敏捷,即使两辆方向不同的列车在同一时间靠站,Mario也能完成换乘。输入:
第1行为n,
第2行为T,
第3行有n-1个整数t1,t2,…,tn−1(1≤ti≤70),
其中ti表示地铁从车站i到i+1的行驶时间(两个方向一样)
第4行为M1(1≤M1≤50),即从第1站出发向右开的列车数目
第5行包含M1个整数d1, d2,…, dM1(0≤di≤250,di<di+1),即各列车的出发时间。
第6、7行描述从第n站出发向左开的列车,格式同第4、5行输出仅包含一行,即最少等待时间。无解输出impossible
分析
时间是单向流逝的,是一个天然的“序”,而影响到决策的只有当前时间和所处的车站
可以用 d(i,j) 表示:在时刻i,处于在车站j(编号为1~n)时,最少还需要等待的时间
边界条件是d(T,n)=0,其他 d(T,i)(i不等于n)为正无穷
有如下3种决策。
- 等1分钟。
- 搭乘往右开的车(如果有)
- 搭乘往左开的车(如果有)
在程序中定义一个三维数组has_train
has_train [t] [i] [0] 表示:时刻t,在车站i是否有往右开的火车
has_train [t] [i] [1] 表示:时刻t,在车站i是否有往左开的火车
核心代码如下:
for (int i = 1; i <= n-1; i++)
dp[T][i] = INF;
dp[T][n] = 0;
for (int i = T-1; i >= 0; i++)
{
for (int j = 1; j <=n ; j++)
{
dp[i][j] = dp[i+1][j] + 1;
if(j<n && has_train[i][j][0] && i+t[j] <= T)
dp[i][j] = min(dp[i][j],dp[i+t[j][j+1]])//右
if(j>1 && has_train[i][j][1] && i+t[j-1] <= T)
dp[i][j] = min(dp[i][j],dp[i+t[j-1][j-1]])//左
}
}
if(dp[0][1])
puts("impossible");
else
cout<<dp[0][1]<<endl;
完整ac码
#include <iostream>
#include <stdio.h>
#include <string.h>
using namespace std;
const int INF=0x3f3f3f3f;
int t[50+10];
int dp[200+10][50+10];
int has_train[200+10][50+10][2];
int main()
{
int n,T,M1,M2,flag;
int casen=0;
while(scanf("%d",&n)!=EOF&&n)
{
memset(has_train,0,sizeof(has_train));
memset(t,0,sizeof(t));
memset(dp,INF,sizeof(dp));
scanf("%d",&T);
for(int i=1; i<n; i++)
scanf("%d",&t[i]);
scanf("%d",&M1);
for(int i=1; i<=M1; i++)
{
scanf("%d",&flag);
for(int j=1; j<=n; j++)
{
flag+=t[j-1];
has_train[flag][j][0]=1;
}
}
scanf("%d",&M2);
for(int i=1; i<=M2; i++)
{
scanf("%d",&flag);
for(int j=n; j>=1; j--)
{
flag+=t[j];
has_train[flag][j][1]=1;
}
}
for(int i=1; i<=n-1; i++)
dp[T][i]=INF;
dp[T][n]=0;
for(int i=T-1; i>=0; i--)
for(int j=1; j<=n; j++)
{
dp[i][j]=dp[i+1][j]+1;
if(j<n&&has_train[i][j][0]&&i+t[j]<=T)
dp[i][j]=min(dp[i][j],dp[i+t[j]][j+1]);
if(j>1&&has_train[i][j][1]&&i+t[j-1]<=T)
dp[i][j]=min(dp[i][j],dp[i+t[j-1]][j-1]);
}
cout<<"Case Number "<<++casen<<": ";
if(dp[0][1]>=INF)
puts("impossible");
else
cout<<dp[0][1]<<endl;
}
return 0;
}
B - The Tower of Babylon
有n(n<=30)种立方体,每种都有无穷多个
要求选一些立方体,摞成一根尽量高的柱子(可以自行选择哪一条作为高)
每个立方体的底面长宽分别严格小于它下方立方体的底面长宽
分析
任何时候都只有顶面(底=顶)尺寸会影响到后续决策,美增加一个立方体以后顶面长和宽都必须严格减小,所以这个图也是DAG,可以套用最长路
由于只有三种面,每种立方体只要三个就够了,每输入一个立方体,就可以算作输入了三个不同的立方体(任选一条边作为高),然后每一个立方体建边,套用DAG上的dp模板
#include <bits/stdc++.h>
using namespace std;
const int MAXN = 100+10;
int n;
int H[MAXN];//记录立方体i的高
int d[MAXN];//记录以i为起点的最大高度
int G[MAXN][MAXN];//记录i是否可以作为j的底,存图
int a[3];//3种边长
struct Cube
{
int x,y;//长和宽
} cube[MAXN];
void have_edge(int i,int j)//i是否可以作为j的底,可以则连边
{
if(cube[i].x>cube[j].x && cube[i].y>cube[j].y)
G[i][j]=1;
}
int dp(int i)
{
int &ans = d[i];
if(ans > 0)
return ans;
ans = H[i];
for(int j=0; j<3*n; j++)
if(G[i][j])
ans=max(ans,H[i]+dp(j));
return ans;
}
int main()
{
int casen = 0;
while(scanf("%d",&n)!=EOF&&n)
{
int ans=0;
memset(d,0,sizeof(d));
memset(G,0,sizeof(G));
for(int i=0; i<n; i++)
{
scanf("%d %d %d",&a[0],&a[1],&a[2]);
sort(a,a+3);
cube[3*i].x=a[0],cube[3*i].y=a[1],H[3*i]=a[2];
cube[3*i+1].x=a[0],cube[3*i+1].y=a[2],H[3*i+1]=a[1];
cube[3*i+2].x=a[1],cube[3*i+2].y=a[2],H[3*i+2]=a[0];
}
for(int i=0; i<3*n; i++)
for(int j=0; j<3*n; j++)
have_edge(i,j);
for(int i=0; i<3*n; i++)
dp(i);
for(int i=0 ; i<3*n ; i++)
ans=max(ans,d[i]);
printf("Case %d: maximum height = %d\n",++casen ,ans);
}
return 0;
}
C - Tour
给定平面n个点(n≤1000)的坐标,按照x递增的顺序给出,保证各点的x都不同且都为正整数
你的任务是设计一条路线,从最左边的点出发,严格向右走到达最右点再严格向左回到最左点,要求除了最左和最右,每个点恰好经过一次,输出最短路径长度
分析
从左到右再回来可以转化成:两个人同事从最左出发,沿着两条不同的路径走,最后到达最右点,并且除了起点和终点都只能有一个人经过,自然想到可以用d(i,j)表示:一个人走到i点,另一个人走到j,还需要走多长距离到达最右点
但是我们发现这样状态好像很难转移,比如计算d(i,j)时,我们不知道能不能让i上的1号同学走到i+1,因为从状态里看不出来i+1有没有被j上的2号同学走过,也就是说这个状态定义的难以转移
然后我们可以简单修改一下定义,让d(i,j)表示:1~max[d(i,j)]全部走过,且两个人目前位置是i和j时,还需要走多长距离到达最右点,在这个定义下d(i,j)=d(j,i),我们再规定始终有i>j,如果j>i了,只需要交换A、B的角色即可,即将i换为j,j换为i,这样,不管是哪个人,下一步只能走到i+1 , i+2,…这些点
那么问题又来了,如果走到i+2,情况变成了“走过1~ i 和 i+2,但是i+1没走过”,不合法
那么直接ban了这个路不就可以了,也就是说,d(i,j)只允许其中一个人走到i+1,而不能走到i+2, i+3,…
换句话说,状态d(i,j)只能转移到d(i+1,j)和d(i+1,i),这里意思就是:如果第一个人直接走到了i+2,那么它再也无法走到i+1了,只能靠第二个人走到i+1,既然如此,现在就让第二个人走到i+1
边界是d(n-1,j) = dist(n-1,n)+dist(j,n),其中dist(a,b)表示点a和b之间的距离,因为根据定义,所有点都走过了,两个人只需直接走到终点。所求结果是dist(1,2)+d(2,1),因为第一步一定是某个人走到了第二个点,根据定义,这就是d(2,1)
#include <bits/stdc++.h>
using namespace std;
const int MAXN=1000+10;
double d[MAXN][MAXN];//第一个走到i第二个人走到j时,还需要走多长距离走完
int n;
struct point
{
int x, y;//坐标
}p[MAXN];
double dist(int A,int B)//p[A]到p[B]距离,随便怎么实现,这里用hypot()
{
int X = p[A].x - p[B].x;
int Y = p[A].y - p[B].y;
return hypot(X, Y);
}
double dp(int i, int j)//i>j
{
double& ans = d[i][j];
if (ans > 0)
return ans;
if (i == n - 1)
return ans = dist(i, n) + dist(j, n);
ans = min(dp(i + 1, j) + dist(i + 1, i), dp(i + 1, i) + dist(i + 1, j));
return ans;
}
int main()
{
while (cin >> n)
{
memset(d, 0, sizeof(d));
for (int i = 1; i <= n; i++)
cin >> p[i].x >> p[i].y;
dp(2, 1);
printf("%.2f\n", dist(2, 1) + d[2][1]);
}
return 0;
}