[知识点] 4.3 动态规划基础模型——区间DP/LIS/LCS

总目录 > 4 动态规划 > 4.3 区间 DP / LIS / LCS

前言

本文主要介绍动态规划的其他几种基础模型——区间 DP、LIS、LCS。区间 DP，LIS 和背包 DP 一样都是线性动态规划（背包 DP 虽然也可以是二维数组，但其实质依然是线性的），相比之下，它们的状态转移更为复杂，而非简单的单向线性递推；而 LCS 是二维的，但递推方式比较简单。

子目录列表

1、区间 DP

2、LIS

3、LCS

4.3 区间 DP / LIS / LCS

1、区间 DP

[NOI 1995] 在一个环上有 n 个数 a1, a2, ..., an，进行 n - 1 次合并操作，每次操作将相邻的两堆合并成一堆，能获得新的一堆中的石子数量的和的得分。你需要最大化你的得分。

之前在 4.1 动态规划基础中就有提到做 DP 的最核心步骤，第一步便是划分状态。

我们对这个合并的过程进行倒推：最终状态为进行了 n - 1 次合并，将[1, n] 这 n 堆数合并成了 1 堆。其中最后一次合并为将 [a1, ai] 和 [ai + 1, an] 两堆合并在一起，i 可以为 [1, n - 1] 的任意整数。其中，[a1, ai] 为 [a1, aj] 和 [aj + 1, ai]（j 为 [1, i - 1] 的任意整数）合并而成，以此类推，这样我们就将整个问题拆分成若干个子问题了，而每个子问题包含两个变量：左端点 l 和右端点 r，状态就设计好了，而转移方式也很一目了然。所以，可以得到：

状态数组：f[i][j] 表示 “区间 [i, j] 所有数合并在一起得到的最大的分”；

状态转移：f[i][j] = max(f[i, k] + f[k + 1, j] + sum[j] - sum[i - 1])，k 可以为 [i, j - 1] 的任意整数，sum 表示 a 的前缀和。

之前的推算步骤为倒推，所以在状态转移时应从 i = j 的情况开始处理，即 len = 1，而后从 1 到 n 枚举 len，总时间复杂度为 O(n ^ 3)。

代码：

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 #define MAXN 105
 5 
 6 int n, a[MAXN], sum[MAXN], f[MAXN][MAXN];
 7 
 8 int main() {
 9     cin >> n;
10     for (int i = 1; i <= n; i++) 
11         cin >> a[i], sum[i] = sum[i - 1] + a[i];
12     for (int len = 1; len <= n; len++)
13         for (int i = 1; i <= 2 * n - 1; i++) {
14             int j = i + len - 1;
15             for (int k = i; k < min(j, 2 * n); k++)
16                 f[i][j] = max(f[i][j], f[i][k] + f[k + 1][j] + sum[j] - sum[i - 1]);
17         }
18     cout << f[1][n];
19     return 0;
20 }

2、LIS 最长上升子序列

> 概念和 O(n ^ 2) 算法

最长上升子序列（Longest Increasing Subsequence），指在一个给定的数值序列中，找到一个子序列，使得这个子序列元素的数值依次递增，并且这个子序列的长度尽可能大。最长递增子序列中的元素在原序列中不一定连续。

举个例子，对于数组 a[] = {4, 2, 3, 1, 5}，其 LIS 为 {2, 3, 5}，长度为 3。

相比之下，LIS 的状态构建和转移比区间 DP 似乎更好理解。由于 LIS 单调递增，所以转移时必然是从较小的数转移而来。比如例子中的 a[3] = 3，可以从 a[2] = 2 转移而来；a[5] = 5，可以从 a[1] = 4, a[2] = 2, a[3] = 3, a[4] = 1 转移而来；那么，直接定义一个一维数组记录当前位置的 LIS 长度即可。

状态数组：f[i] 表示 “序列前 i 个数的 LIS 长度”；

状态转移：f[i] = max(f[j]) + 1，其中 j ∈ [1, i)，且 a[j] < a[i]。

时间复杂度为 O(n ^ 2)。

核心代码：

1 for (int i = 1; i <= n; i++)
2     for (int j = 1; j < i; j++)
3         if (a[j] < a[i]) f[i] = max(f[i], f[j] + 1);

最终结果为 f[n] + 1。

不过，这并非最优解。

> 二分优化

由于数列本身没有单调性，不能直接使用二分。令 f[i] 表示 “LIS 长度为 i 时末尾的数”。

还是上方的例子。开始枚举：

① a[1] = 4：i = 1，即 f[1] = 4；

② a[2] = 2：2 < 4，由于对于后面的数而言，2 显然更优（即 > 4 的数是 > 2 的数的子集），所以直接替换，即 f[1] = 2；

③ a[3] = 3：3 > 2，可以构成递增子序列，直接加入，f[2] = 3，说明 LIS 长度为 2 时末尾数为 3；

④ a[4] = 1：1 > 3，不可递增，从头比较：1 > 2，同②，直接替换，f[1] = 1；

⑤ a[5] = 5：5 > 3，同③，直接加入，f[3] = 5.

所以，最终答案为 3。

（越写越觉得这不像 DP。。）

其本质是持续维护一个 LIS，如果当前数比这个 LIS 最末尾数（最大数）更大，直接加入；如果小，则在 LIS 之中找到刚好比它大的一个数替换掉。

感觉其实这不算 DP 了，更像贪心的思路套上 DP 的模板，但还是写在这提供一种思路吧。

暴力做的话同样也是 O(n ^ 2)，好就好在 LIS 本身是单调的，所以在 LIS 中查找时可以直接二分，这样就可以做到 O(n log n) 了。

代码：

 1 #include <bits/stdc++.h>
 2 using namespace std;
 3 
 4 #define MAXN 105
 5 
 6 int n, o, m, f[MAXN], top;
 7 
 8 int main() {
 9     cin >> n;
10     for (int i = 1; i <= n; i++) {
11         cin >> o;
12         if (o > f[top]) top++, f[top] = o;
13         else {
14             int l = 1, r = top;
15             while (l <= r) {
16                 m = (l + r) >> 1;
17                 if (o < f[m]) {
18                     if (o < f[m - 1]) r = m;
19                     else {
20                         f[m] = o;
21                         break;
22                     }
23                 }
24                 else l = m + 1;
25             }
26         }
27     }
28     cout << top;
29     return 0;
30 }

3、LCS 最长公共子序列

> 概念

最长公共子序列（Longest Common Subsequence），指在两个给定的数值序列中，找到一个两个序列都包含的公共子序列，使得这个子序列元素的数值依次递增，并且这个子序列的长度尽可能大。最长递增子序列中的元素在原序列中不一定连续。

例如：a[] = {1, 2, 3, 3, 5}, b[] = {1, 4, 3, 5, 2}，它们的 LCS 为 {1, 3, 5}。

> 二维动态规划

其实几维并不重要，这里强调是二维的，是为了给后面较为复杂的动态规划进行铺垫——DP 并不都是线性的，它可以在任何结构上进行状态转移。

延续 LIS 的思路，状态数组包含序列位置和 LCS 长度关系。因为存在两个需要比较的序列，则需要两个变量：

状态数组：f[i][j] 表示 “a 的前 i 位和 b 的前 j 位构成的 LCS 长度”；

状态转移：

观察上方例子：{1, 3, 5} 中，5 是由 a[5] = b[4] = 5 提供的，而b[5] = 2，不影响结果，也就是说，a.len = 5, b.len = 4 时和 b.len = 5 时结果一致，可得：

f[i][j] = f[i][j - 1]，if a[i] != b[j]；

同理，也可能碰到数组 a 多出不相等的一位，即f[i][j] = f[i - 1][j]，if a[i] != b[j]；

综上，在两者中取较大值为较优解，即：

f[i][j] = max(f[i][j - 1], f[i - 1][j])，if a[i] != b[j]；

3 是由 a[3] = b[3] = 3 提供的，也就是说，a.len = 3, b.len = 3 时结果为 2；而 a[4] = 3 时结果同样不变；那么最后的 5 是 a 和 b 同时往后枚举一位递推得到的，可得：

f[i][j] = f[i - 1][j - 1], if a[i] = b[j]。

语言描述可能有点抽象，下面给出三个图。

图 1 演示的是第二种情况，即 a 的前 i 位和 b 的前 j 位相等；

图 2 演示的是第一种情况，即 a 的前 i 位和 b 的前 j 位不相等；

图 3 演示的是最终结果，即 ans = f[5][5] = 3；

核心代码：

1 for (int i = 1; i <= n; i++)
2     for (int j = 1; j <= m; j++)
3         f[i][j] = a[i] == b[j] ? f[i - 1][j - 1] + 1 : max(f[i - 1][j], f[i][j - 1]);

最终答案显然为 f[n][m]。时间复杂度为 O(n ^ 2)。

posted @ 2020-04-17 00:06 jinkun113 阅读(472) 评论(0) 编辑收藏举报

刷新页面返回顶部

jinkun113

To seek out and to understand.

[知识点] 4.3 动态规划基础模型——区间DP/LIS/LCS

公告