一.动态规划原理
多阶段决策问题中,各个阶段采取的决策,一般来说是与时间有关的,决策依赖于当前状态,又随即引起状态的转移,一个决策序列就是在变化的状态中产生出来的,故有“动态”的含义,称这种解决多阶段决策最优化问题的方法为动态规划方法。
设计动态规划具体要满足以下三个条件:
动态规划是一门思想,可以引用于很多比较复杂的解决方案中,我个人给他做的定位就是
二.数字三角形
如图,从9开始往下走,每次只能走相邻的两个节点,问如何走才能使数字之和最大化。
这个问题如果采用遍历的方式那么路径将会呈指数级别增长,计算量非常大
20 x 21 x 22 ....x 2n-1 = 2 n(n-1) / 2
如果采用贪婪算法每次选择最大值 ,到达第四层的时候:9+15+8+9 < 9+12+10+18。这种方式只能得到局部最优解,而无法得到全局最优解。
显然这两种方式都不是最优的解决方式。如果采用DP(动态规划)可以有效解决。
具体思想:我们从最底层往上走,从5五层到第四层开始比较,选择最大的值:分别为19+2,18+10,9+10,5+16.然后基于这4个值继续比较从第4层往第三层走,最后第三层变为18+10+10,18+10+6,5+16+8.按照这种思路依次走到第一层。
接下来由第4层往第3层走 分别选出最大的方案为28+10,29+6,21+8,如图:
由第3层往第2层 分别选出最大的方案为38+12,34+15,如图:
由第2层往第1层,可选出38+12,34+15 如图:
最优方案 如图:
这样保证了,从第5层开始,每一次抉择后的结构都是最优的结果,并且再也不会收到其他因素的音响值不会改变,且有由小到大最终每一个点的连线其实都是自他开始往下的最优解。
刚好满足了DP算法的三个特性:
1.最优化原理 2.无后向性 3子问题重叠
测试数据和代码如下:
int array[5][5] = { 7,0,0,0,0, 3,8,0,0,0, 8,1,0,0,0, 2,7,4,4,0, 4,5,2,6,5, }; //动态划分 for (int i = 4 - 1; i >= 0; i--) { for (int j = 0; j <= 4; j++) { array[i][j] = MAX(array[i + 1][j] , array[i+1][j+1]) + array[i][j]; } } NSLog(@"结果%d",array[0][0]);
三.01背包
有编号分别为a,b,c,d,e的五件物品,它们的重量分别是2,2,6,5,4,它们的价值分别是6,3,5,4,6,现在给你个承重为10的背包,如何让背包里装入的物品具有最大的价值总和?
DP思想如下:拆分结构,寻找最优子元素。 最大结构是5个物品中寻找重量和为10且价值最大的物品,那么最优子结构就是从1个物品选出重量和为1且价值最大的元素,如果条件满足则就是他本身,不满足则记为0,然后再一次往上递增。
含义 | name | weight | value | 1kg | 2kg | 3kg | 4kg | 5kg | 6kg | 7kg | 8kg | 9kg | 10kg |
abcde可选 | a | 2 | 6 | 0 | 6 | 6 | 9 | 9 | 12 | 12 | 15 | 15 | 15(结束) |
bcde可选 | b | 2 | 3 | 0 | 3 | 3 | 6 | 6 | 9 | 9 | 9 | 10 | 11 |
cde可选 | c | 6 | 5 | 0 | 0 | 0 | 6 | 6 | 6 | 6 | 6 | 10 | 11 |
de可选 | d | 5 | 4 | 0 | 0 | 0 | 6 | 6 | 6 | 6 | 6 | 10 | 10 |
e可选 | e | 4 | 6 | 0(开始) | 0 | 0 | 6 | 6 | 6 | 6 | 6 | 6 | 6 |
表格填写的顺序是从左下开始填写直到右上结束,如果这个表格你能手动填写完,那么你就已经学会了01背包规划方案。
为了方便理解,我们选择几个典型的进行描述:
表格从白色部分开始数
第5行第2列(e2):可选物只有e,且有一个负重为2的背包,背包的最大价值为0,因为e本身的重量为4,放不下,这个表格故填0.
第2行第2列(b2):可选物为b,c,d,e,且有一个负重为2的背包,背包最大价值为3,因为物品b重量为2刚好可以放下且价值为3,表格填3.
第1行第2列(a2):可选物为a,b,c,d,e,且有一个负重为2的背包,背包最大价值为6,a和b都可以放入背包,且a的价值更大,选择a,表格填6.
第1行第4列(a4):可选物a,b,c,d,e, 且有一个负重为4的背包,a可以装下,那么到底装不装如a呢?我们需要做一个比较,假如装下a,背包剩余负重2,可选物为b,c,d,e, (b2)+6=9大于b4,选择装入a更好,所以a4的填入9。
第1行第5列(a6):装入a后剩余重量为4,可选b,c,d,e. b(4)+6=12 > b6所以填入12.
若 f[i,j]表示在前i件物品中选择若干件放在承重为 j 的背包中,可以取得的最大价值。Pi表示第i件物品的价值,Wi表示第i件物品的重量,01背包核心方程式为:
f[i,j] = Max{ f[i-1,j-Wi] + Pi( j >= Wi ) , f[i-1,j] }
核心代码如下:
- (void)viewDidLoad { [super viewDidLoad]; // Do any additional setup after loading the view, typically from a nib. //背包能装入的总重量为10 5个物品的重量分别为2,2,6,5,4 价值为6,3,5,4,9 int knapsackSize = 10; MyItem * item1 = [MyItem myitemWithWeight:2 value:6]; MyItem * item2 = [MyItem myitemWithWeight:2 value:3]; MyItem * item3 = [MyItem myitemWithWeight:6 value:5]; MyItem * item4 = [MyItem myitemWithWeight:5 value:4]; MyItem * item5 = [MyItem myitemWithWeight:4 value:9]; NSArray* myitems = @[item1,item2,item3,item4,item5]; int value = [self getValueByKnapsack:myitems knapsackSize:knapsackSize]; NSLog(@"背包可装入的最大价值%d",value); } //计算01背包能装入的价格最优的值 MyItem(有两个属性value和weight) 可以用于被装的元素 size背包一共能载重多少 -(int)getValueByKnapsack:(NSArray<MyItem *> *)myitems knapsackSize:(int)knapsackSize { //初始化一个 二维表格记录每个最优策略的值 空间换时间 行数为总元素个数 列数为背包从0开始到总重量数 int ** a; a = (int **)malloc(sizeof(int *) * myitems.count); for (int i = 0; i < myitems.count; i++) { a[i] = (int *)malloc(sizeof(int) * knapsackSize + 1); a[i][0] = 0; } //最优子元素从只装1个元素且载重只为1开始计算,保证最优子元素且无后向性 //遍历重量从假如背包只能载重1的策略开始 for (int i = 1; i <= knapsackSize; i ++) { //可选物品从 0 到 所有 for (int j = 0; j < myitems.count; j++) { MyItem * item = myitems[j]; if (i < item.weight) { //背包装不下的情况 if (j == 0) { //只有一个可选数据时 a[j][i] = 0; } else { //有多个可选数据 则使用上一个最优策略 a[j][i] = a[j-1][i]; } } else { //背包装的下的情况 if (j == 0) { //只有一个可选数据 这个数据记录为最优策略 a[j][i] = item.value; } else { //有多个可选择的物品 则和上一个最优策略比较选择最优策略 a[j][i] = MAX(a[j - 1][i], item.value + a[j - 1][i - item.weight]); } } } } //查询最大值 int maxValue = 0; for (int i = 1; i <= knapsackSize; i ++) { for (int j = 0; j < myitems.count; j ++) { if (a[j][i] > maxValue) { maxValue = a[j][i]; } } } return maxValue; }
四.迪杰斯特拉最短路径
求从1号点开始出发到后面所有点的最短路径。
为了跟直观的让计算机来表示这组路径,我们可以把他转化为一个二维数组。
表示每个点到其他点的距离,无法直接到达通过∞表示
DP思想如下:
要求1到所有点的位置都是最最短路径,那么计算出来了后1随便指定一个点都肯定是最优的,同样在这个大组合中先拆分为子元素,子元素就是1到任意一个指定点比如1-2、1-3等等,然后从最小子元素开始算起。
用一个1位数组dis来表示1到各个点的路程,初始如下:
这个最小的子元素就是1-2,因为2号是离1最近的点,再没有谁比他更近了,那么dis[2]的值就成了确定了,以后再不会收谁的影响而改变了,1-2的距离等于1肯定是最短的路径。
既然已经选择了2,那么再看看接下来从2号能到哪里呢,有2-3,2-4. 还是和以前一样开始比较看看谁才是最优解dis[2] + e[2][3] = 1 + 9 < dis[3], 1-2在2-3的方式比直接从1-3更优,因此dis[3] 更新为10,这个过程叫做“松弛”,1好到3号的路程就是dis[3],通过2-3松弛成功。这就是迪杰斯特拉核心思想:通过边来松弛各个路程。同样dis[2] + e[2][4] = 4 < dis[4],因此dis[4]更新为4,松弛后的dis数组变为:
接下来继续从剩下的3,4,5,6中选出距离1最近的点进比较。3,4,5,6最近的是4,dis[4]的值变成了确定值. 4可以经过的路线有4-3,4-5,4-6.按照之前的方案新一轮松弛之后dis数组变为:
接下来从剩下的3,5,6中选出距离1最近的点,点3。dis[3]变成了确定了,3有3-5。松弛后变为:
接下来从5,6中选出5,有5-6,松弛后变为:
最后还有6,松弛后变为:
最终这个松弛后的Dis数组就是从1到各个点的最佳路径。
总结一下就是:每次知道离原点(上面例子就是1)最近的一个点,然后以该点为中心进行松弛,知道所有的点都走完一个轮询,最终得到所有离原点最近的点。
核心代码如下:
//构建邻接矩阵 实际上为6,6 为了方便显示所有从1~6开始计算 int matrix[7][7] = { 0,0,0,0,0,0,0, 0,0,1,12,999,999,999, 0,999,0,9,3,999,999, 0,999,999,0,999,5,999, 0,999,999,4,0,13,15, 0,999,999,999,999,0,4, 0,999,999,999,999,999,0 }; int book[7] = {0,0,0,0,0,0,0}; //记录已经处理过的顶点 int dis[7] = {0,0,1,12,999,999,999}; //最佳路径 默认是1到所有点的距离,999为无线大距离 注: 从1开始计算 int u = 0; for (int i = 1; i<=6; i++) { //表示查找次数 int min = 999; //寻找距离顶点1最近的点,且为松弛的点 for (int j = 1; j <=6; j++) { if (book[j] == 0 && dis[j] < min) { min = dis[j]; u = j; } } book[u] = 1; //标志U目前是距离1点最近且未处理的点, 马上要用于处理 for (int k = 1; k <= 6 ; k++) { //查找U点可以到达的路权,且比较计算最优的dis if (matrix[u][k] < 999) { if (dis[u] + matrix[u][k] < dis[k]) { //如果1点到U点+U点到K点的距离 < dis[k]的距离,则更新最优距离 dis[k] = dis[u] + matrix[u][k]; } } } }
五.拓展:
最后再拓展一个小问题,你可以先不看思路尝试着自己用动态划分的思想解决。
对于一个从1到N的连续整数集合{1,2,3......,n-1,n},划分为两个子集,保证两个集合的和相等。
例:n=3可分为{1,2}and{3}. 如果n=7可分为 {1,6,7} and {2,3,4,5} {2,5,7} and {1,3,4,6} {3,4,7} and {1,2,5,6} {1,2,4,7} and {3,5,6}
设计一个程序 输入任意数划分出可行的方案数,不能划分则输出0.
思路如下:
1+2+3.....+n = n*(n+1)/2, 两个相同的子集任意一个的和肯定为总数和的一半,顾和一定为n*(n+1)/4,计作f(n). 所以这个题可以转化为从集合中找出和为f(n)的子集合的数量,将他除以2就是我们可以得到的划分方案。 这样又可以用01背包的思想再次转换,就成了背包问题了。物品1,2,3......,n, 价值分别为1,2,3......,n.给定一个称重为f(n)的背包,问一共有多少种方案让其刚好放满,最后将方案除以2就是真确结果。
表格划分如下: