数据结构与算法(十二)——算法-动态规划

一、青蛙跳台阶&斐波那契数列

1、问题

  一只青蛙跳台阶,每次可以跳 1 层或 2 层。青蛙跳到 n 层一共有多少种跳法?

2、思想

  先把问题规模缩小,考虑 n = 1时,n = 2的解。那么,显然有:

  (1)边界条件:dp[1] = 1、dp[2] = 2
  (2)再考虑 n = 3时,逆向思维一下,要跳 3 层,是不是只能是从第 2 阶跳 1 层到或者是从第 1 阶跳 2 层到。所以dp[3] = dp[2] + dp[1]。
  (3)同理n = 4时,是不是也是只能是从第 3 阶跳 1 层到或者是从第 2 阶跳 2 层到。所以dp[4] = dp[3] + dp[2]。
  (3)……
  (4)同理可得,状态转移方程:dp[n] = dp[n - 1] + dp[n - 2]。

3、代码示例

 1 // 递归.时间复杂度:O(2^n).空间复杂度:O(1)
 2 public int jumpFloor(int target) {
 3     if (target == 1) {
 4         return 1;
 5     }
 6     if (target == 2) {
 7         return 2;
 8     }
 9 
10     return jumpFloor(target - 1) + jumpFloor(target - 2);
11 }
12 
13 // 循环(dp数组).时间复杂度:O(n).空间复杂度:O(n)
14 public int jumpFloor2(int target) {
15     if (target == 1) {
16         return 1;
17     }
18 
19     int[] dp = new int[target + 1];
20     dp[1] = 1;
21     dp[2] = 2;
22     for (int i = 3; i <= target; i++) {
23         dp[i] = dp[i - 1] + dp[i - 2];
24     }
25     return dp[target];
26 }
27 
28 // 滚动数组.时间复杂度:O(n).空间复杂度:O(1)
29 public int jumpFloor3(int target) {
30     if (target == 1) {
31         return 1;
32     }
33     int num1 = 1, num2 = 2, temp = num2;
34 
35     for (int i = 3; i <= target; i++) {
36         temp = num1 + num2;
37         num1 = num2;
38         num2 = temp;
39     }
40 
41     return temp;
42 }

二、网格路径

1、问题

  有一个 m*n 的网格,从 [1, 1] 出发,每次只能向右或向下,抵达 [m, n] 一共有多少种方案?如图:

2、思想

  先把问题规模缩小,考虑从 [1, 1]到 [1, 2],到 [1, 3],到 [1, 4]……和从 [1, 1]到[2, 1],到 [3, 1]……,是不是只能一直向右和向下,那么,显然有:
  (1)边界条件:dp[1][n]  = 1、dp[m][1] = 1
  (2)再考虑到 [2, 2] ,是不是只有 [1, 2] 向下或者 [2, 1] 向右。所以dp[2][2] = dp[1][2] + dp[2][1]。
  (3)同理可得,状态转移方程:dp[m][n] = dp[m - 1][n] + dp[m][n - 1]。

3、代码示例

 1 // 3*6. m=3,n=6
 2 public static int gridPath(int m, int n) {
 3     int[][] dp = new int[m + 1][n + 1];
 4     for (int i = 1; i <= n; i++) {
 5         dp[1][i] = 1;
 6     }
 7 
 8     for (int i = 1; i <= m; i++) {
 9         dp[i][1] = 1;
10     }
11 
12     // 遍历二维数组
13     for (int i = 2; i <= m; i++) {
14         for (int j = 2; j <= n; j++) {
15             dp[i][j] = dp[i - 1][j] + dp[i][j - 1];
16         }
17     }
18 
19     return dp[m][n];
20 }

三、最长递增子序列

1、问题

  问题很好理解。例如:[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列,但它不是递增的。

  nums = [10,9,2,5,3,7,101,18] --> 4 [2,3,7,101] 或者 [2,3,7,18]
  nums = [0,1,0,3,2,3] --> 4 [0,1,2,3]
  nums = [7,7,7,7,7,7,7] --> 1 [7]

2、思想

  定义:dp[i] 表示以 nums[i] 这个数结尾的最长递增子序列的长度。为了理解这个定义,比如:dp[3] 就是以 nums[3] = 4 结尾的最长递增子序列(1,3,4)的长度,也就是3。

  根据这个定义,最终结果(子序列的最大长度)应该是 dp 数组中的最大值。

  过程动图

  那么,显然有:
  (1)边界条件:dp[*] = 1
  (2)动态转移方程:dp[i] = nums[i] > nums[j] && max(dp[i], dp[j] + 1)

3、代码示例

 1 // 时间复杂度 O(N^2)
 2 public int lis(int[] nums) {
 3     int[] dp = new int[nums.length];
 4     // dp数组全部初始化为 1
 5     Arrays.fill(dp, 1);
 6 
 7     for (int i = 0; i < nums.length; i++) {
 8         for (int j = 0; j < i; j++) {
 9             if (nums[i] > nums[j]) {
10                 dp[i] = Math.max(dp[i], dp[j] + 1);
11             }
12         }
13     }
14 
15     int res = 0;
16     for (int i : dp) {
17         res = Math.max(res, i);
18     }
19 
20     return res;
21 }

四、最长回文子串

1、问题

  给定一个字符串 s,长度为 n,找到 s 中最长的回文子串。

  s = "abbac" --> "abba"
  s = "cbbd" --> "bb"
  s = "babad" --> "aba"

2、思想

  定义:dp[i][j]表示 s 中 i 到 j 的字符串是否是回文串。那么,显然有:
  (1)边界条件:dp[i][i] = true;dp[i][j] = true 当 s[i] = s[j] && j - i = 1
  (2)状态转移方程:dp[i][j] = ( s[i] = s[j] && dp[i + 1][j - 1] )

3、代码示例

 1 public int getLongestPalindrome(String s, int n) {
 2     boolean[][] dp = new boolean[n][n];
 3     int max = 1;
 4 
 5     // 字符串首尾字母长度差 (len = j - i) 0~n-1
 6     for (int len = 0; len < n; len++) {
 7 
 8         for (int i = 0; i < n - len; i++) {
 9             int j = i + len;
10 
11             // 如果字符串 i 到 j 的首尾相等,再根据字符串 i+1 到 j-1 来确定,即得到递推公式
12             if (s.charAt(i) == s.charAt(j)) {
13                 // 边界条件
14                 if (len == 0 || len == 1) {
15                     dp[i][j] = true;
16                 } else {
17                     // 状态转移方程
18                     dp[i][j] = dp[i + 1][j - 1];
19                 }
20 
21                 if (dp[i][j]) {
22                     // 更新最大长度
23                     max = Math.max(max, len + 1);
24                 }
25             }
26         }
27     }
28     return max;
29 }

五、兑换硬币

1、问题

  给定一个正整数数组 coins,表示不同面值的硬币,整数 amount 代表总金额。求可以凑成总金额所需的最少硬币个数,不能组成总金额,返回 -1。硬币数量无限。

  coins = [1,3,5], amout = 11 -> 3(11 = 5 + 5 + 1)
  coins = [2,5], amout = 3 -> -1

2、思想

  用dp[i] = j 表示凑够 i 元最少需要 j 个硬币。先把问题规模缩小,考虑,如果有面值为1元、3元和5元的硬币若干枚,如何用最少的硬币凑够11元?答案很简单是 3(5+5+1)。则:
  i = 0,表示凑够0元最少需要的硬币数。当然就是不选硬币,需要0个硬币。

  dp[0] = 0

  i = 1,只有1元可用,选择 1 元硬币,金额变为 i - 1 = 0,接下来只需要凑够 0 元即可。

  dp[1] = dp[i - 1] + 1 = dp[0] + 1 = 0 + 1 = 1

  i = 2,只有1元可用,选择 1 元硬币,金额变为 i - 1 = 1,接下来只需要凑够 1 元即可。

  dp[2] = dp[i - 1] + 1 = dp[1] + 1 = 1 + 1 = 2

  i = 3,可选硬币有 1 和 3,则分两种情况
  ①选择 1 元硬币,金额变为 i - 1 = 2,接下来只需要凑够 2 元即可。

  dp[3] = dp[i - 1] + 1 = dp[2] + 1 = 3 (3个1元的)

  ②选择 3 元硬币,金额变为 i - 3 = 0,接下来只需要凑够 0 元即可。

  dp[3] = dp[i - 3] + 1 = dp[0] + 1 = 1 (1个3元的)

  显然,上述情况取小:

  dp[3] = min{dp[i - 1] + 1, dp[i - 3] + 1} = 1

  i = 4~amount,同理可得。

  归纳一下:在已知dp[0]、dp[1]、dp[2]、……dp[i - 1]求 dp[i] 时,在可取的硬币面值(i >= coins[j],coins[j]表示第 j 个硬币的面值),都取一次,则问题就可降级为 dp[i - coins[j]],而这个值是已知,最后取小即可。
  案例说明:

  不妨:coins = [1,3,5,20],求dp[11].
  目的是凑成11,那么,从可选的硬币里选择一枚,所有情况如下:
  选择coins[0]=1,则还需要凑11-1=10,即,在arr中凑10,所以dp[11]=dp[10] + 1。
  选择coins[1]=3,则还需要凑11-3=8,即,在arr中凑8,所以dp[11]=dp[11-3] + 1。
  选择coins[2]=5,则还需要凑11-5=6,即,在arr中凑6,所以dp[11]=dp[11-5] + 1。
  注意:coins[3]=20 > 11,是不可选的。所以可选条件是 i >= coins[j]。
  最后,在上述情况取小即可。

  那么,有:
  (1)边界条件:dp[0] = 0
  (2)状态转移方程:dp[i] = min(dp[i], dp[i - coins[j]] + 1)。i - coins[j] >= 0

3、代码示例

 1 // 兑换硬币
 2 public int minMoney(int[] coins, int amount) {
 3     // 数组下标从 0 开始
 4     int[] dp = new int[amount + 1];
 5 
 6     // 若最小硬币是 1,那么兑换 amount 最多用 amount 个硬币。则 dp[amount] 最大等于 amount
 7     // 由于下面要取小,所以给一个越界值
 8     Arrays.fill(dp, amount + 1);
 9 
10     // 边界条件
11     dp[0] = 0;
12     // 依次求dp[1]、dp[2]……dp[amount]
13     for (int i = 1; i < amount + 1; i++) {
14 
15         // 遍历硬币的面值
16         for (int coin : coins) {
17             // 该硬币面值可取
18             if (i - coin >= 0) {
19                 dp[i] = Math.min(dp[i], dp[i - coin] + 1);
20             }
21         }
22     }
23 
24     // 要是流程走下来 dp 值是非法值.说明换不出来
25     return dp[amount] == amount + 1 ? -1 : dp[amount];
26 }

  注:贪心不正确
  coins = [1,4,5,7], amout=17
  贪心结果:7+7+1+1+1 -> 5
  实际:7+5+4+1 ->4

六、0-1背包问题

1、问题

  一共有N件物品,第i(i从1开始)件物品的重量为w[i],价值为v[i]。在总重量不超过背包容量C的情况下,能够装入背包的最大价值是多少?
  通俗的说,就是你有一个麻袋,你去超市顺便拿东西,在不超出麻袋容量的情况下,尽可能的拿的物品价值和最大。
  要求:①装入背包的总价值最大,且重量不超出。②物品要么拿,要么不拿,不可重复拿。

2、思想

  举一个案例,有一个背包,容量为4kg,现有物品:

物品
重量
价值
吉他(G)
1kg
1500
音响(S)
4kg
3000
电脑(L)
3kg
2000

  显然:可取方案有G+L,价值3500;或S,价值3000。最佳方案:G+L,3500。
  定义:dp[i][j]表示在前 i 个物品中选择,能够装入容量为 j 的背包中的最大价值。即:

物品\重量
0kg
1kg
2kg
3kg
4kg
 
0
0
0
0
0
吉他(G)
0
       
音响(S)
0
       
电脑(L)
0
       

  先把问题规模缩小,按一行一行(必须),背包容量为0、1、2、……C=4的顺序,填写上表。
  表示物品只有吉他,有:

物品\重量
0kg
1kg
2kg
3kg
4kg
 
0
0
0
0
0
吉他(G)
0
1500
1500
1500
1500
音响(S)
0
       
电脑(L)
0
       

  表示物品有吉他、音响,有:

物品\重量
0kg
1kg
2kg
3kg
4kg
 
0
0
0
0
0
吉他(G)
0
1500
1500
1500
1500
音响(S)
0
1500
1500
1500
3000
电脑(L)
0
       

  表示物品有吉他、音响、电脑,有:

物品\重量
0kg
1kg
2kg
3kg
4kg
 
0
0
0
0
0
吉他(G)
0
1500
1500
1500
1500
音响(S)
0
1500
1500
1500
3000
电脑(L)
0
1500
1500
2000
3500

  那么,有:
  (1)边界条件:dp[i][0] = dp[0][j] = 0。上表格第一列、第一行为0
  (2)状态转移方程:dp[i][j] = max(dp[i - 1][j], v[i] + dp[i - 1][j - w[i]])

3、代码示例

 1 public class Knapsack {
 2     private Goods[] goods;
 3     // 背包的容量
 4     private int c;
 5     // dp[i][j]:表示在前i个物品中选择,能够装入容量为j的背包中的最大价值
 6     private int[][] dp;
 7     private int[][] path;
 8 
 9     public Knapsack(Goods[] goods, int c) {
10         if (goods == null || goods.length == 0 || c <= 0) {
11             return;
12         }
13         this.goods = goods;
14         this.c = c;
15 
16         this.dp = new int[goods.length][c + 1];
17         this.path = new int[goods.length][c + 1];
18 
19         // 初始化第一列、第一行为0.可不写,默认就是0
20 //        for (int i = 0; i < dp.length; i++) {
21 //            dp[i][0] = 0;
22 //        }
23 //        for (int i = 0; i < dp[0].length; i++) {
24 //            dp[0][i] = 0;
25 //        }
26     }
27 
28     // 动态规划
29     public void dp() {
30         for (int i = 1; i < dp.length; i++) {
31             for (int j = 1; j < dp[0].length; j++) {
32                 // 表明当前物品放不了背包
33                 if (goods[i].weight > j) {
34                     dp[i][j] = dp[i - 1][j];
35                 } else {
36                     dp[i][j] = Math.max(dp[i - 1][j], goods[i].value + dp[i - 1][j - goods[i].weight]);
37 
38                     // 用于记录物品选择策略
39                     if (dp[i - 1][j] < goods[i].value + dp[i - 1][j - goods[i].weight]) {
40                         path[i][j] = 1;
41                     }
42                 }
43             }
44         }
45 
46     }
47 
48     // 获取物品的选择策略
49     public List<Goods> getPlan() {
50         // 1.查看 dp 填写情况
51         for (int i = 0; i < dp.length; i++) {
52             for (int j = 0; j < dp[i].length; j++) {
53                 System.out.print(dp[i][j] + " ");
54             }
55             System.out.println();
56         }
57 
58         // 2.物品选择策略
59         List<Goods> result = new ArrayList<>();
60         int i = path.length - 1;
61         int j = path[0].length - 1;
62         // 从path的最后一个开始找
63         while (i > 0 && j > 0) {
64             if (path[i][j] == 1) {
65                 result.add(goods[i]);
66 
67                 j = j - goods[i].weight;
68             }
69             i--;
70         }
71         return result;
72     }
73 }
74 
75 // 物品
76 class Goods {
77     public String name;
78     // 物品重量
79     public int weight;
80     // 物品价值
81     public int value;
82 
83     public Goods(String name, int weight, int value) {
84         this.name = name;
85         this.weight = weight;
86         this.value = value;
87     }
88 
89     @Override
90     public String toString() {
91         return "Goods{" +
92                 "name='" + name + '\'' +
93                 ", weight=" + weight +
94                 ", value=" + value +
95                 '}';
96     }
97 }
0-1背包
 1 public class Main {
 2     public static void main(String[] args) {
 3         Goods[] goods = new Goods[4];
 4 
 5         // 为了使得 goods[1] 是第1个物品
 6         goods[0] = null;
 7         goods[1] = new Goods("吉他", 1, 1500);
 8         goods[2] = new Goods("音响", 4, 3000);
 9         goods[3] = new Goods("电脑", 3, 2000);
10 
11         // 背包容量
12         final int C = 4;
13         Knapsack knapsack = new Knapsack(goods, C);
14         System.out.println("动态规划dp:");
15         knapsack.dp();
16 
17         final List<Goods> plan = knapsack.getPlan();
18         System.out.println("物品选择策略:");
19         System.out.println(plan);
20     }
21 }
22 
23 // 结果
24 动态规划dp:
25 0 0 0 0 0 
26 0 1500 1500 1500 1500 
27 0 1500 1500 1500 3000 
28 0 1500 1500 2000 3500 
29 物品选择策略:
30 [Goods{name='电脑', weight=3, value=2000}, Goods{name='吉他', weight=1, value=1500}]
测试类

4、说明

  0-1背包问题不太好理解。下面用一些图文帮助读者理解。
  首先,我们深刻理解一下0-1背包的问题,如图:

  不妨假设,在这前 i 个物品中,选取总重量不超过背包容量 C 的物品,且使得物品总价值最大。选择策略叫方案A,此时的最大总价值设为 maxValue。这里理解一下前 i 个物品,由于动态规划问题是规模逐渐增大的,所以,要姑且把物品看成是"有序的"。

  那么,我们思考一个问题,如果此时来了第 i + 1个物品(价值:V,重量:W),会怎么样呢?如图:

  主要分为两种情况谈论:
  1、W > C :第 i + 1 个物品(钻石)不可取。那么,此时(总体物品是 i + 1个,但是)是不是就相当于没有第 i + 1 这个物品(因为在i + 1个物品中选择,不会取到第 i + 1这个物品),问题的解,是不是就等价于图一(在 i 个物品中选择,背包容量为C),所以,就是方案A,最大总价值就是 maxValue。
  2、W <= C :第 i + 1个物品(钻石)可取。又分为两种情况:即拿或不拿。(注:这是0-1背包,一个物品要么不选择,要么只选择一次)
    2.1:不拿。同样,此时(这种情况下)问题的解,与上述(W > C)相同,即方案A,最大总价值就是 maxValue
    2.2:拿。那么,第 i + 1 个物品(钻石)已经被选择了,此时背包容量还有(C - W)。由于第 i + 1个物品已经被选择了,此时问题规模,就是在前 i 个物品中,选取总重量不超过背包容量 C - W 的物品。价值就是dp[i][c - w]。
  由于2.1和2.2属于一种情况。所以整个问题的解就是 max( maxValue, V + dp[i][c - w] )。

  下面,再对上面填表的过程,以及代码做一些解释:

posted @ 2021-09-17 14:11  Craftsman-L  阅读(841)  评论(4编辑  收藏  举报