算法设计与分析——0-1背包问题（动态规划）

一、问题描述

有N件物品和⼀个最多能被重量为W 的背包。第i件物品的重量是weight[i]，得到的价值是value[i] 。每件物品只能⽤⼀次，求解将哪些物品装⼊背包⾥物品价值总和最⼤。

二、问题分析

2.1 确定dp数组以及下标的含义

对于背包问题，有⼀种写法，是使⽤⼆维数组，即dp[i][j] 表示从下标为[0-i]的物品⾥任意取，放进容量为j的背包，价值总和最⼤是多少。

2.2 确定递推公式

再回顾⼀下dp[i][j]的含义：从下标为[0-i]的物品⾥任意取，放进容量为j的背包，价值总和最⼤是多少。
那么可以有两个⽅向推出来dp[i][j]，

由dp[i - 1][j]推出，即背包容量为j，⾥⾯不放物品i的最⼤价值，此时dp[i][j]就是dp[i - 1][j]
由dp[i - 1][j - weight[i]]推出，dp[i - 1][j - weight[i]] 为背包容量为j - weight[i]的时候不放物品i的最⼤价值，那么dp[i - 1][j - weight[i]] + value[i] （物品i的价值），就是背包放物品i得到的最⼤价值

所以递归公式： dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);

2.3 dp数组如何初始化

关于初始化，⼀定要和dp数组的定义吻合，否则到递推公式的时候就会越来越乱。
⾸先从dp[i][j]的定义出发，如果背包容量j为0的话，即dp[i][0]，⽆论是选取哪些物品，背包价值总和⼀定为0。如图

再看其他情况。
状态转移⽅程 dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]); 可以看出i 是由 i-1 推导出来，那么i为0的时候就⼀定要初始化。

dp[0][j]，即：i为0，存放编号0的物品的时候，各个容量的背包所能存放的最⼤价值。

那么很明显当 j < weight[0]的时候，dp[0][j] 应该是 0，因为背包容量⽐编号0的物品重量还⼩。

当j >= weight[0]是，dp[0][j] 应该是value[0]，因为背包容量放⾜够放编号0物品。

代码初始化如下：

for (int j = 0 ; j < weight[0]; j++) { // 当然这⼀步，如果把dp数组预先初始化为0了，这⼀步就可以省略，但很多同学应该没有想清楚这⼀点。
    dp[0][j] = 0;
}
// 正序遍历
for (int j = weight[0]; j <= bagWeight; j++) {
    dp[0][j] = value[0];
}

此时dp数组初始化情况如图所示：

dp[0][j] 和 dp[i][0] 都已经初始化了，那么其他下标应该初始化多少呢？

其实从递归公式： dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]); 可以看出dp[i][j] 是⼜左上⽅数值推导出来了，那么其他下标初始为什么数值都可以，因为都会被覆盖。

初始-1，初始-2，初始100，都可以！

但只不过⼀开始就统⼀把dp数组统⼀初始为0，更⽅便⼀些。
如图：

最后初始化代码如下：

// 初始化 dp
vector<vector<int>> dp(weight.size() + 1, vector<int>(bagWeight + 1, 0));
for (int j = weight[0]; j <= bagWeight; j++) {
    dp[0][j] = value[0];
}

2.4 确定遍历顺序

在如下图中，可以看出，有两个遍历的维度：物品与背包重量
那么问题来了，先遍历物品还是先遍历背包重量呢？其实都可以！！但是先遍历物品更好理解。
那么我先给出先遍历物品，然后遍历背包重量的代码。

// weight数组的⼤⼩ 就是物品个数
for(int i = 1; i < weight.size(); i++) { // 遍历物品
    for(int j = 0; j <= bagWeight; j++) { // 遍历背包容量
       if (j < weight[i]) 
           dp[i][j] = dp[i - 1][j]; // 这个是为了展现dp数组⾥元素的变化
       else 
           dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
    }
}

2.5 举例推导dp数组

来看⼀下对应的dp数组的数值，如图：

C++代码：

    void test_2_wei_bag_problem1() {
        vector<int> weight = {1, 3, 4};
        vector<int> value = {15, 20, 30};
        int bagWeight = 4;
        // ⼆维数组
        vector<vector<int>> dp(weight.size() + 1, vector<int>(bagWeight + 1, 0));
        // 初始化
        for (int j = bagWeight; j >= weight[0]; j--) {
            dp[0][j] = dp[0][j - weight[0]] + value[0];
        }
        // weight数组的⼤⼩ 就是物品个数
        for(int i = 1; i < weight.size(); i++) { // 遍历物品
            for(int j = 0; j <= bagWeight; j++) { // 遍历背包容量
                if (j < weight[i]) dp[i][j] = dp[i - 1][j];
                else dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);
            }
        }
        cout << dp[weight.size() - 1][bagWeight] << endl; 
    }
    int main() {
        test_2_wei_bag_problem1();
    }

三、一维DP数组

对于背包问题其实状态都是可以压缩的。

在使⽤⼆维数组的时候，递推公式：dp[i][j] = max(dp[i - 1][j], dp[i - 1][j - weight[i]] + value[i]);

其实可以发现如果把dp[i - 1]那⼀层拷⻉到dp[i]上，表达式完全可以是：dp[i][j] = max(dp[i][j], dp[i][j] - weight[i]] + value[i]);

于其把dp[i - 1]这⼀层拷⻉到dp[i]上，不如只⽤⼀个⼀维数组了，只⽤dp[j]（⼀维数组，也可以理解是⼀个滚动数组）。

这就是滚动数组的由来，需要满⾜的条件是上⼀层可以重复利⽤，直接拷⻉到当前层。

读到这⾥估计⼤家都忘了 dp[i][j]⾥的i和j表达的是什么了，i是物品，j是背包容量。dp[i][j] 表示从下标为[0-i]的物品⾥任意取，放进容量为j的背包，价值总和最⼤是多少。⼀定要时刻记住这⾥i和j的含义，要不然很容易看懵了。

3.1 确定dp数组的定义

在⼀维dp数组中，dp[j]表示：容量为j的背包，所背的物品价值可以最⼤为dp[j]。

3.2 ⼀维dp数组的递推公式

dp[j]为容量为j的背包所背的最⼤价值，那么如何推导dp[j]呢？

dp[j]可以通过dp[j - weight[j]]推导出来，dp[j - weight[i]]表示容量为j - weight[i]的背包所背的最⼤价值。

dp[j - weight[i]] + value[i] 表示容量为 j - 物品i重量的背包加上物品i的价值。（也就是容量为j的背包，放⼊物品i了之后的价值即：dp[j]）

此时dp[j]有两个选择，

⼀个是取⾃⼰dp[j]
⼀个是取dp[j - weight[i]] + value[i]

指定是取最⼤的，毕竟是求最⼤价值，所以递归公式为：dp[j] = max(dp[j], dp[j - weight[i]] + value[i]);
可以看出相对于⼆维dp数组的写法，就是把dp[i][j]中i的维度去掉了。

3.3 ⼀维dp数组如何初始化

关于初始化，⼀定要和dp数组的定义吻合，否则到递推公式的时候就会越来越乱。

dp[j]表示：容量为j的背包，所背的物品价值可以最⼤为dp[j]，那么dp[0]就应该是0，因为背包容量为0 所背的物品的最⼤价值就是0。

那么dp数组除了下标0的位置，初始为0，其他下标应该初始化多少呢？
看⼀下递归公式：dp[j] = max(dp[j], dp[j - weight[i]] + value[i]);

dp数组在推导的时候⼀定是取价值最⼤的数，如果题⽬给的价值都是正整数那么⾮0下标都初始化为0就可以了，如果题⽬给的价值有负数，那么⾮0下标就要初始化为负⽆穷。

这样才能让dp数组在递归公式的过程中取的最⼤的价值，⽽不是被初始值覆盖了。那么我假设物品价值都是⼤于0的，所以dp数组初始化的时候，都初始为0就可以了。

3.4 ⼀维dp数组遍历顺序

代码如下：

for(int i = 0; i < weight.size(); i++) { // 遍历物品
    for(int j = bagWeight; j >= weight[i]; j--) { // 遍历背包容量
        dp[j] = max(dp[j], dp[j - weight[i]] + value[i]);
    }
}

这⾥⼤家发现和⼆维dp的写法中，遍历背包的顺序是不⼀样的！

⼆维dp遍历的时候，背包容量是从⼩到⼤，⽽⼀维dp遍历的时候，背包是从⼤到⼩。为什么呢？

倒叙遍历是为了保证物品i只被放⼊⼀次！

举⼀个例⼦：物品0的重量weight[0] = 1，价值value[0] = 15

如果正序遍历
dp[1] = dp[1 - weight[0]] + value[0] = 15
dp[2] = dp[2 - weight[0]] + value[0] = 30

此时dp[2]就已经是30了，意味着物品0，被放⼊了两次，所以不能正序遍历。

为什么倒叙遍历，就可以保证物品只放⼊⼀次呢？

倒叙就是先算dp[2]
dp[2] = dp[2 - weight[0]] + value[0] = 15 （dp数组已经都初始化为0）
dp[1] = dp[1 - weight[0]] + value[0] = 15

所以从后往前循环，每次取得状态不会和之前取得状态重合，这样每种物品就只取⼀次了。

那么问题⼜来了，为什么⼆维dp数组历的时候不⽤倒叙呢？

因为对于⼆维dp，dp[i][j]都是通过上⼀层即dp[i - 1][j]计算⽽来，本层的dp[i][j]并不会被覆盖！

再来看看两个嵌套for循环的顺序，代码中是先遍历物品嵌套遍历背包容量，那可不可以先遍历背包容量嵌套遍历物品呢？

不可以！

因为⼀维dp的写法，背包容量⼀定是要倒序遍历（原因上⾯已经讲了），如果遍历背包容量放在上⼀层，那么每个dp[j]就只会放⼊⼀个物品，即：背包⾥只放⼊了⼀个物品。（这⾥如果读不懂，就在回想⼀下dp[j]的定义，或者就把两个for循环顺序颠倒⼀下试试！）

所以⼀维dp数组的背包在遍历顺序上和⼆维其实是有很⼤差异的。

3.5 举例推导dp数组

⼀维dp，分别⽤物品0，物品1，物品2 来遍历背包，最终得到结果如下：