学习笔记②

与分治法不同的是，适合于用动态规划求解的问题，经分解得到子问题往往不是互相独立的。若用分治法来解这类问题，则分解得到的子问题数目太多，有些子问题被重复计算了很多次。如果能够保存已解决的子问题的答案，而在需要时再找出已求得的答案，这样就可以避免大量的重复计算，节省时间。我们可以用一个表来记录所有已解的子问题的答案。不管该子问题以后是否被用到，只要它被计算过，就将其结果填入表中。这就是动态规划法的基本思路。

动态规划核心思想:

A ： "1+1+1+1+1+1+1+1 =？"

A ： "上面等式的值是多少"

B ：计算 "8"

A : 在上面等式的左边写上 "1+" 呢？

A : "此时等式的值为多少"

B : 很快得出答案 "9"

A : "你怎么这么快就知道答案了"

A : "只要在8的基础上加1就行了"

A : "所以你不用重新计算，因为你记住了第一个等式的值为8!动态规划算法也可以说是 '记住求过的解来节省时间'"

动态规划最核心的思想，就在于拆分子问题，记住过往，减少重复计算。

如何拆分问题，才是动态规划的核心。

而拆分问题，靠的就是状态的定义和状态转移方程的定义。这也是动态规划的本质所在。

例题解析：洛谷 P1255 数楼梯

题目描述

楼梯有 \(N\) 阶，上楼可以一步上一阶，也可以一步上二阶。

编一个程序，计算共有多少种不同的走法。

输入格式

一个数字，楼梯数。

输出格式

输出走的方式总数。

输入输出样例

输入 #1

输出 #1

说明/提示

对于 \(60%\) 的数据，\(N≤50\) ，

对于 \(100%\) 的数据，\(1≤N≤5000\) 。

要想跳到第10级台阶，要么是先跳到第9级，然后再跳1级台阶上去;要么是先跳到第8级，然后一次迈2级台阶上去。
同理，要想跳到第9级台阶，要么是先跳到第8级，然后再跳1级台阶上去;要么是先跳到第7级，然后一次迈2级台阶上去。
要想跳到第8级台阶，要么是先跳到第7级，然后再跳1级台阶上去;要么是先跳到第6级，然后一次迈2级台阶上去。
......

假设跳到第n级台阶的跳数我们定义为f(n)，很显然就可以得出以下公式：

\[f(10) = f(9)+f(8) \]

\[f(9) = f(8)+f(7) \]

\[f(8) = f(7)+f(6) \]

\[...... \]

\[f(3) = f(2)+f(1) \]

其中，我们从第10层台阶的计算公式推算到第9阶，再往前推到第8阶的过程，就是状态之间的转移，依照此规律，我们可以得到一个通用的状态转移方程：

\[f(n) = f(n-1) + f(n-2) \]

那 \(f(2)\) 或者 \(f(1)\) 等于多少呢？

当只有2级台阶时，有两种跳法，第一种是直接跳两级，第二种是先跳一级，然后再跳一级。即 \(f(2) = 2\) ；当只有1级台阶时，只有一种跳法，即 \(f(1) = 1\) ；

因此可以用递归去解决这个问题：


int dfs(int n)
{
    if(n==1)
        return 1;
     if(n==2)
        return 2;
    return dfs(n-1)+dfs(n-2);
}

然而我们在洛谷提交代码，只拿到了50tps，TLE（时间超限）了五个点。

为什么超时了呢？递归耗时在哪里呢？先画出递归树看看：

要计算原问题 f(10)，就需要先计算出子问题 f(9) 和 f(8)
然后要计算 f(9)，又要先算出子问题 f(8) 和 f(7)，以此类推。
一直到 f(2) 和 f(1），递归树才终止。

我们先来看看这个递归的时间复杂度吧：

递归时间复杂度 = 解决一个子问题时间*子问题个数

一个子问题时间 = \(f(n-1)+f(n-2)\) ，也就是一个加法的操作，所以复杂度是 O(1)；
问题个数 = 递归树节点的总数，递归树的总节点 = \(2^n-1\) ，所以是复杂度 \(O(2^n)\)

因此，爬台阶，递归解法的时间复杂度 \(= O(1) \times O(2^n) = O(2^n)\) ，就是指数级别的，爆炸增长的，如果n比较大的话，超时很正常的了。

回过头来，你仔细观察这颗递归树，你会发现存在大量重复计算，比如 \(f(8)\) 被计算了两次，\(f(7)\) 被重复计算了3次...所以这个递归算法低效的原因，就是存在大量的重复计算！

既然存在大量重复计算，那么我们可以先把计算好的答案存下来，即造一个备忘录，等到下次需要的话，先去备忘录查一下，如果有，就直接取就好了，备忘录没有才开始计算，那就可以省去重新重复计算的耗时啦！这就是带备忘录的解法。

带备忘录的递归解法（自顶向下）

一般的题目中，常使用数组作为备忘录储存信息。

第一步，f（10）= f(9) + f(8)，f(9) 和f（8）都需要计算出来，然后再加到备忘录中，如下：

第二步， f(9) = f（8）+ f（7），f（8）= f（7）+ f(6), 因为 f(8) 已经在备忘录中啦，所以可以省掉，f(7),f（6）都需要计算出来，加到备忘录中~

第三步， f(8) = f（7）+ f(6),发现f(8)，f(7),f（6）全部都在备忘录上了，所以都可以剪掉。

所以呢，用了备忘录递归算法，递归树变成光秃秃的树干咯，如下：

带备忘录的递归算法，子问题个数=树节点数= \(n\) ，解决一个子问题还是 \(O(1)\) ,所以带备忘录的递归算法的时间复杂度是 \(O(n)\) 。接下来呢，我们用带备忘录的递归算法去撸代码，解决这个数楼梯阶问题的超时问题咯~，代码如下：

long long dfs(int n)
{
    if(n==0) return 0;
    if(n<=2) return n;
    if(a[n]>0) return a[n];
    else
    {
        a[n]=dfs(n-1)+dfs(n-2);
        return a[n];
    }
}

此时，在时间复杂度上我们就过关了。其实这种算法也是记忆化搜索，顾名思义，为每一次搜索注入记忆，记录以前得到的值在后面的搜索中直接利用，从而避免了重复的步骤。

自底向上的动态规划

动态规划跟带备忘录的递归（记忆化搜索）解法基本思想是一致的，都是减少重复计算，时间复杂度也都是差不多。但是呢：

带备忘录的递归，是从f(10)往f(1）方向延伸求解的，所以也称为自顶向下的解法。
动态规划从较小问题的解，由交叠性质，逐步决策出较大问题的解，它是从f(1)往f(10）方向，往上推求解，所以称为自底向上的解法。

动态规划有几个典型特征，最优子结构、状态转移方程、边界、重叠子问题。在数楼梯问题中：

f(n-1)和f(n-2) 称为 f(n) 的最优子结构
f(n)= f（n-1）+f（n-2）就称为状态转移方程
f(1) = 1, f(2) = 2 就是边界啦
比如f(10)= f(9)+f(8),f(9) = f(8) + f(7) ,f(8)就是重叠子问题。

我们来看下自底向上的解法，从f(1)往f(10）方向，想想是不是直接一个for循环就可以解决啦，如下：

带备忘录的递归解法，空间复杂度是O(n)，但是仔细观察上图，可以发现，f（n）只依赖前面两个数，所以只需要两个变量a和b来存储，就可以满足需求了，因此空间复杂度是O(1)。这样一来既节省了时间又节省了空间。

代码如下：

    for(int i=3;i<=n;i++)
    {
        ans=a+b;
        a=b,b=ans;
    }
    cout<<ans;

动态规划的解题套路

我们前面提到了分治法和dp的区别，那么什么时候可以使用dp呢？

这就不得不提到dp的两个条件了。

最优子结构性质。一个最优化策略的子策略总是最优的。
无后效性。某阶段的状态一旦确定，则此后过程的演变不再受此前各状态及决策的影响。即每个当前状态会且仅会决策出下一状态，而不直接对未来的所有状态负责。

也就是说，“未来与过去无关”，当前的状态是此前历史的一个完整的总结，此后的历史只能通过当前的状态去影响过程未来的演变。

可以浅显地理解为：

\[Future\ never\ has\ to\ do\ with\ past\ time\ , \]
\[but\ present\ does. \]
现在决定未来，未来与过去无关。

而对于子问题的重叠性，动态规划实质上是一种以空间换时间的技术，它在实现的过程中，不得不存储产生过程中的各种状态，所以它的空间复杂度要大于其他的算法。选择动态规划算法是因为动态规划算法在空间上可以承受，而搜索算法在时间上却无法承受，所以我们舍空间而取时间。

动态规划的解题思路

方式：

正推（自底向上）：

从初始状态开始，通过对中间阶段的决策的选择，达到结束状态。我们也称之为递推。

倒推（自顶向下）：

从结束状态开始，通过对中间阶段的决策的选择，达到初始状态。我们可以称之为记忆化搜索。

步骤

1. 确定状态和状态变量

除了“问题的规模”这一直接的状态，还应考虑一些附加的，用来满足“最优子结构”性质。

2. 确定决策并写出状态转移方程

根据状态的实际意义去转移，一般有两种考虑方式：“如何分解”和“如何合并”，根据实际选择。状态值转移方式有时并不容易直接看出，当前状态也许和多个子结构有关，其中的系数也不确定，一般先采用穷举法在演草纸上一步一步推导去找到规律。

3. 寻找边界条件

这一步不容小觑。边界的数量和数值都是随题目变化的，需要依题意而定。

4. 分析复杂度

时间复杂度=状态总数x单次转移复杂度

5. 编程实现程序（正推或倒推）

注意各类边界，注意数据类型（爆int？double精度？）

例如上文讲到的例题，当把“正解”提交后，我得到了一个暖暖的60分。原因无他，这题的输出值太大，无符号long long也容不下，需要用到人人见了都要唇角含笑的高精度。

posted @ 2024-02-02 04:23 Sure042 阅读(12) 评论(0) 编辑收藏举报

刷新页面返回顶部