动态规划解题套路框架

动态规划问题的一般形式就是求最值:例如求最长递增子序列,最小编辑距离等等

求解动态规划的核心问题是穷举:因为要求最值,所以要把可行答案穷举出来找最值

重叠子问题:动态规划的穷举有时会存在【重叠子问题】,如果单纯的暴力穷举的话效率往往十分低下,所以一般需要【备忘录】或者【DP table】来优化过程

最优子结构:动态规划问题一定会具备最优子结构,即原问题的最值是通过子问题的最值得到

状态转移方程:虽然动态规划的核心思想就是穷举求最值,但是问题可以千变万化,穷举所有可行解其实并不是一件容易的事,只有列出正确的「状态转移方程」,才能正确地穷举。

明确 base case -> 明确「状态」-> 明确「选择」 -> 定义 dp 数组/函数的含义

得出初代框架

//初始化base case
dp[0][0][...]=base;
//进行状态转移
for 状态1 in 状态1的所有取值
    for 状态2 in 状态2的所有取值
        for...
            dp[状态1][状态2][...]=求最值(选择1,选择2...)

列举两题:

一 斐波那契数列

斐波那契数列没有求最值,所以严格来说并不是动态规划问题

1.暴力递归

斐波那契数列的数学形式就是递归

int fib(int N){
	if(N==1||N==2)return 1;
    return fib(N-1)+fib(N-2);
}

虽然简洁但是低效。

首先计算子问题个数,即递归树中节点的总数。显然二叉树节点总数为指数级别,所以子问题个数为 O(2^n)。

然后计算解决一个子问题的时间,在本算法中,没有循环,只有 f(n - 1) + f(n - 2) 一个加法操作,时间为 O(1)。

所以,这个算法的时间复杂度为二者相乘,即 O(2^n),指数级别,爆炸。

书中对于这段解释较好,所以直接拷贝

这个不用多说了,学校老师讲递归的时候似乎都是拿这个举例。我们也知道这样写代码虽然简洁易懂,但是十分低效,低效在哪里?假设 n = 20,请画出递归树:

img

PS:但凡遇到需要递归的问题,最好都画出递归树,这对你分析算法的复杂度,寻找算法低效的原因都有巨大帮助。

这个递归树怎么理解?就是说想要计算原问题 f(20),我就得先计算出子问题 f(19)f(18),然后要计算 f(19),我就要先算出子问题 f(18)f(17),以此类推。最后遇到 f(1) 或者 f(2) 的时候,结果已知,就能直接返回结果,递归树不再向下生长了。

观察递归树,很明显发现了算法低效的原因:存在大量重复计算,比如 f(18) 被计算了两次,而且你可以看到,以 f(18) 为根的这个递归树体量巨大,多算一遍,会耗费巨大的时间。更何况,还不止 f(18) 这一个节点被重复计算,所以这个算法及其低效。

这就是动态规划问题的第一个性质:重叠子问题。下面,我们想办法解决这个问题。

2.带备忘录的递归

一般使用一个数组来充当这个【备忘录】,当然也可以使用哈希表(字典)

class Solution {
public:
    int fib(int n) {
        vector<int>memo(n+1,0);
        traver(n,memo);
        return memo[n]; 
    }
    int traver(int n,vector<int>&memo){
        //base case
        if(n==1||n==0){
            memo[n]=n;
            return n;
        }
        //如果备忘录中有,直接返回,不再重复计算
        if(memo[n]!=0){
            return memo[n];
        }
        memo[n]=traver(n-1,memo)+traver(n-2,memo);
        return memo[n];
    }
};

现在,画出递归树,你就知道「备忘录」到底做了什么。

img

实际上,带「备忘录」的递归算法,把一棵存在巨量冗余的递归树通过「剪枝」,改造成了一幅不存在冗余的递归图,极大减少了子问题(即递归图中节点)的个数。

img

递归算法的时间复杂度怎么计算?就是用子问题个数乘以解决一个子问题需要的时间

子问题个数,即图中节点的总数,由于本算法不存在冗余计算,子问题就是 f(1), f(2), f(3)f(20),数量和输入规模 n = 20 成正比,所以子问题个数为 O(n)。

解决一个子问题的时间,同上,没有什么循环,时间为 O(1)。

所以,本算法的时间复杂度是 O(n),比起暴力算法,是降维打击。

3、dp 数组的迭代(递推)解法

有了上一步「备忘录」的启发,我们可以把这个「备忘录」独立出来成为一张表,通常叫做 DP table,在这张表上完成「自底向上」的推算岂不美哉!即直接从最底下,最简单、问题规模最小的base case往上推,直到得到想要的答案。

class Solution {
public:
    int fib(int n) {
        if(n==0)return 0;
        //dp table
        vector<int> dp(n+1,0);
        //base case
        dp[0]=0;dp[1]=1;
        for(int i=2;i<=n;i++){
            dp[i]=dp[i-1]+dp[i-2];
        }
        return dp[n];
    }
};

img

画个图就很好理解了,而且你发现这个 DP table 特别像之前那个「剪枝」后的结果,只是反过来算而已。实际上,带备忘录的递归解法中的「备忘录」,最终完成后就是这个 DP table,所以说这两种解法其实是差不多的,大部分情况下,效率也基本相同。

这里,引出「状态转移方程」这个名词,实际上就是描述问题结构的数学形式:

img

为啥叫「状态转移方程」?其实就是为了听起来高端。

f(n) 的函数参数会不断变化,所以你把参数 n 想做一个状态,这个状态 n 是由状态 n - 1 和状态 n - 2 转移(相加)而来,这就叫状态转移,仅此而已。

你会发现,上面的几种解法中的所有操作,例如 return f(n - 1) + f(n - 2)dp[i] = dp[i - 1] + dp[i - 2],以及对备忘录或 DP table 的初始化操作,都是围绕这个方程式的不同表现形式。

可见列出「状态转移方程」的重要性,它是解决问题的核心,而且很容易发现,其实状态转移方程直接代表着暴力解法。

千万不要看不起暴力解,动态规划问题最困难的就是写出这个暴力解,即状态转移方程

只要写出暴力解,优化方法无非是用备忘录或者 DP table,再无奥妙可言。

4 最后一步优化

根据斐波那契数列的状态转移方程,当前状态只和之前的两个状态有关,其实并不需要那么长的一个 DP table 来存储所有的状态,只要想办法存储之前的两个状态就行了。

所以,可以进一步优化,把空间复杂度降为 O(1)。这也就是我们最常见的计算斐波那契数的算法:

class Solution {
public:
    int fib(int n) {
        //base case
        if(n==0||n==1){
            return n;
        }
        //分别代表dp[i-1],dp[i-2]
        int fib_1=1;
        int fib_2=1;
        for(int i=2;i<=n;i++){
            //dp[i]=dp[i-1]+dp[i-2]
            int fib_i=fib_1+fib_2;
            //滚动更新
            fib_1=fib_2;
            fib_2=fib_i;
        }
        return fib_1;
    }
};

这一般是动态规划问题的最后一步优化,如果我们发现每次状态转移只需要 DP table 中的一部分,那么可以尝试缩小 DP table 的大小,只记录必要的数据,从而降低空间复杂度。

上述例子就相当于把DP table 的大小从 n 缩小到 2。后续的动态规划章节中我们还会看到这样的例子,一般来说是把一个二维的 DP table 压缩成一维,即把空间复杂度从 O(n^2) 压缩到 O(n)。

二、凑零钱问题

这题关于动态规划的另一个重要特性【最优子结构】。

斐波那契数列的例子严格来说不算动态规划,因为没有涉及求最值,以上旨在说明重叠子问题的消除方法,演示得到最优解法逐步求精的过程。

这是力扣第 322 题「 零钱兑换」:

给你 k 种面值的硬币,面值分别为 c1, c2 ... ck,每种硬币的数量无限,再给一个总金额 amount,问你最少需要几枚硬币凑出这个金额,如果不可能凑出,算法返回 -1 。

1 暴力递归

首先,这个问题是动态规划问题,因为它具有「最优子结构」的。要符合「最优子结构」,子问题间必须互相独立。啥叫相互独立?你肯定不想看数学证明,我用一个直观的例子来讲解。

比如说,假设你考试,每门科目的成绩都是互相独立的。你的原问题是考出最高的总成绩,那么你的子问题就是要把语文考到最高,数学考到最高…… 为了每门课考到最高,你要把每门课相应的选择题分数拿到最高,填空题分数拿到最高…… 当然,最终就是你每门课都是满分,这就是最高的总成绩。

得到了正确的结果:最高的总成绩就是总分。因为这个过程符合最优子结构,“每门科目考到最高”这些子问题是互相独立,互不干扰的。

但是,如果加一个条件:你的语文成绩和数学成绩会互相制约,数学分数高,语文分数就会降低,反之亦然。这样的话,显然你能考到的最高总成绩就达不到总分了,按刚才那个思路就会得到错误的结果。因为子问题并不独立,语文数学成绩无法同时最优,所以最优子结构被破坏。

回到凑零钱问题,为什么说它符合最优子结构呢?比如你想求 amount = 11 时的最少硬币数(原问题),如果你知道凑出 amount = 10 的最少硬币数(子问题),你只需要把子问题的答案加一(再选一枚面值为 1 的硬币)就是原问题的答案。因为硬币的数量是没有限制的,所以子问题之间没有相互制,是互相独立的。

那么,既然知道了这是个动态规划问题,就要思考如何列出正确的状态转移方程

1、确定 base case,这个很简单,显然目标金额 amount 为 0 时算法返回 0,因为不需要任何硬币就已经凑出目标金额了。

2、确定「状态」,也就是原问题和子问题中会变化的变量。由于硬币数量无限,硬币的面额也是题目给定的,只有目标金额会不断地向 base case 靠近,所以唯一的「状态」就是目标金额 amount

3、确定「选择」,也就是导致「状态」产生变化的行为。目标金额为什么变化呢,因为你在选择硬币,你每选择一枚硬币,就相当于减少了目标金额。所以说所有硬币的面值,就是你的「选择」。

4、明确 dp 函数/数组的定义。我们这里讲的是自顶向下的解法,所以会有一个递归的 dp 函数,一般来说函数的参数就是状态转移中会变化的量,也就是上面说到的「状态」;函数的返回值就是题目要求我们计算的量。就本题来说,状态只有一个,即「目标金额」,题目要求我们计算凑出目标金额所需的最少硬币数量。

所以我们可以这样定义 dp 函数:dp(n) 表示,输入一个目标金额 n,返回凑出目标金额 n 所需的最少硬币数量

搞清楚上面这几个关键点,解法的伪码就可以写出来了:

// 伪码框架
int coinChange(int[] coins, int amount) {
    // 题目要求的最终结果是 dp(amount)
    return dp(coins, amount)
}

// 定义:要凑出金额 n,至少要 dp(coins, n) 个硬币
int dp(int[] coins, int n) {
    // 做选择,选择需要硬币最少的那个结果
    for (int coin : coins) {
        res = min(res, 1 + dp(n - coin))
    }
    return res
}

根据伪码,我们加上 base case 即可得到最终的答案。显然目标金额为 0 时,所需硬币数量为 0;当目标金额小于 0 时,无解,返回 -1:

class Solution {
public:
    int coinChange(vector<int>& coins, int amount) {
        //题目结果是dp【amount】
        return dp(coins,amount);
    }
    int dp(vector<int>& coins, int amount){
        //base case
        if(amount==0)return 0;
        if(amount<0)return -1;
        //res表示所需最少硬币数量,由于求最小值所以初始化为INT_MAX
        int res=INT_MAX;
        for(int coin:coins){
            //计算子问题答案
            int subProblem=dp(coins,amount-coin);
            //子问题无解则跳过
            if(subProblem==-1)continue;
            //在子问题中选择最优解 然后+1
            res=min(res,subProblem+1);
        }
        return res==INT_MAX?-1:res;
    }
};

PS:这里 coinChangedp 函数的签名完全一样,所以理论上不需要额外写一个 dp 函数。但为了后文讲解方便,这里还是另写一个 dp 函数来实现主要逻辑。

另外,我经常看到有人问,子问题的结果为什么要加 1(subProblem + 1),而不是加硬币金额之类的。我这里统一提示一下,动态规划问题的关键是 dp 函数/数组的定义,你这个函数的返回值代表什么?你回过头去搞清楚这一点,然后就知道为什么要给子问题的返回值加一了。

至此,状态转移方程其实已经完成了,以上算法已经是暴力解法了,以上代码的数学形式就是状态转移方程:

img

至此,这个问题其实就解决了,只不过需要消除一下重叠子问题,比如 amount = 11, coins = {1,2,5} 时画出递归树看看:

img

递归算法的时间复杂度分析:子问题总数 x 解决每个子问题所需的时间

子问题总数为递归树节点个数,这个比较难看出来,是 O(n^k),总之只要是树形结构,节点个数必然是是指数级别的。每个子问题中含有一个 for 循环,复杂度为 O(k)。所以总时间复杂度为 O(k * n^k),指数级别。

2 带备忘录的递归

class Solution {
public:
    vector<int> memo;
    int coinChange(vector<int>& coins, int amount) {
        //初始化为特殊值
        memo.assign(amount+1,-666);
        return dp(coins,amount);
    }
    int dp(vector<int>& coins, int amount){
        //base case
        if(amount==0)return 0;
        if(amount<0)return -1;
        //备忘录中有
        if(memo[amount]!=-666)return memo[amount];
        //记录所需最小硬币数
        int res=INT_MAX;
        for(int coin:coins){
            //求解子问题
            int subProblem=dp(coins,amount-coin);
            //子问题不存在,跳过
            if(subProblem==-1)continue;
            //子问题中选择最优解
            res=min(subProblem+1,res);
        }
        //结果存入备忘录
        memo[amount]=res==INT_MAX?-1:res;
        return memo[amount];
    }
};

不画图了,很显然「备忘录」大大减小了子问题数目,完全消除了子问题的冗余,所以子问题总数不会超过金额数 n,即子问题数目为 O(n)。处理一个子问题的时间不变,仍是 O(k),所以总的时间复杂度是 O(kn)。

3 dp数组的迭代解法

当然,我们也可以自底向上使用 dp table 来消除重叠子问题,关于「状态」「选择」和 base case 与之前没有区别,dp 数组的定义和刚才 dp 函数类似,也是把「状态」,也就是目标金额作为变量。不过 dp 函数体现在函数参数,而 dp 数组体现在数组索引:

dp 数组的定义:当目标金额为 i 时,至少需要 dp[i] 枚硬币凑出

根据我们文章开头给出的动态规划代码框架可以写出如下解法:

class Solution {
public:
    int coinChange(vector<int>& coins, int amount) {
        vector<int>memo(amount+1,amount+1);
        //base case
        memo[0]=0;
        // 外层 for 循环在遍历所有状态的所有取值
        for(int i=0;i<memo.size();i++){
            // 内层 for 循环在求所有选择的最小值
            for(int coin:coins){
                //子问题无解,跳过
                if(i-coin<0)continue;
                memo[i]=min(memo[i],memo[i-coin]+1);
            }
        }
        return (memo[amount]==amount+1)?-1:memo[amount];
    }
};

img

PS:为啥 dp 数组初始化为 amount + 1 呢,因为凑成 amount 金额的硬币数最多只可能等于 amount(全用 1 元面值的硬币),所以初始化为 amount + 1 就相当于初始化为正无穷,便于后续取最小值。为啥不直接初始化为 int 型的最大值 Integer.MAX_VALUE 呢?因为后面有 dp[i - coin] + 1,这就会导致整型溢出。

三、最后总结

第一个斐波那契数列的问题,解释了如何通过「备忘录」或者「dp table」的方法来优化递归树,并且明确了这两种方法本质上是一样的,只是自顶向下和自底向上的不同而已。

第二个凑零钱的问题,展示了如何流程化确定「状态转移方程」,只要通过状态转移方程写出暴力递归解,剩下的也就是优化递归树,消除重叠子问题而已。

如果你不太了解动态规划,还能看到这里,真得给你鼓掌,相信你已经掌握了这个算法的设计技巧。

计算机解决问题其实没有任何奇技淫巧,它唯一的解决办法就是穷举,穷举所有可能性。算法设计无非就是先思考“如何穷举”,然后再追求“如何聪明地穷举”。

列出状态转移方程,就是在解决“如何穷举”的问题。之所以说它难,一是因为很多穷举需要递归实现,二是因为有的问题本身的解空间复杂,不那么容易穷举完整。

posted @ 2022-03-26 09:45  BailanZ  阅读(61)  评论(0编辑  收藏  举报