【LeetCode动态规划#14】子序列系列题（最长递增子序列、最长连续递增序列、最长重复子数组、最长公共子序列）

最长递增子序列

力扣题目链接(opens new window)

给你一个整数数组 nums ，找到其中最长严格递增子序列的长度。

子序列是由数组派生而来的序列，删除（或不删除）数组中的元素而不改变其余元素的顺序。例如，[3,6,2,7] 是数组 [0,3,1,6,2,2,7] 的子序列。

示例 1：

输入：nums = [10,9,2,5,3,7,101,18]
输出：4
解释：最长递增子序列是 [2,3,7,101]，因此长度为 4 。

示例 2：

输入：nums = [0,1,0,3,2,3]
输出：4

示例 3：

输入：nums = [7,7,7,7,7,7,7]
输出：1

提示：

1 <= nums.length <= 2500
-10^4 <= nums[i] <= 104

思路

什么是"最长递增子序列"？

以 nums = [1,8,3,2,5,6,7,9] 为例

[1,8]是nums中的一个"递增子序列"，[3,5,6]是另一个"递增子序列"，且后者更长

由上述例子可知，子序列的选取可以不连续，但必须按照数组原有顺序来取（意思就是可以在原有顺序上跳过某些数从而构成更长的子序列）

基于此原则，上述例子中的"最长递增子序列"是[3,5,6,7,9]

明确这一点后，可以开始讨论解题方法

五步走

1、2 确定dp数组含义+确定递推公式

dp[i]: 以nums[i]为结尾的最长递增子序列的长度

这么理解呢？

举个例子，nums = [1,8,3,2,5,6]

遍历时是用双指针去实现子序列的查找的，因此还需要一个指针j用来遍历区间内的所有元素，寻找该区间内最长的子序列

假设j是小于i的，那么两者构成的区间就是[j,i]

此时就有dp[j] < dp[i]，即以nums[0]为结尾的最长递增子序列（即[1]）小于以nums[1]为结尾的最长递增子序列（即[1,8]）

此时，指针i向后移动，j也继续在[j,i]范围内遍历，当遍历到以下位置时，可以找到推导出dp[i]的前置位置

当前，dp[j]仍小于dp[i]（len[1,3,5] < len[1,3,5,6]），根据dp数组的定义，dp[j]是"长度"。

就这个层面而言，dp[i]与dp[j]的长度差距为1，所以有dp[i] = dp[j] + 1;

上面说过，指针j是在[j,i]范围内从左向右遍历，目的是寻找子序列

因此每次遍历都会得到一个新的dp[i]

所以递推公式应该是：dp[i] = max(dp[i], dp[j] + 1);

这里解释一下在遍历过程中，子序列是如何定义的，以及我们比较dp[i]和dp[j]到底在比较什么东西

因为i和j都是从左往右遍历，所以每次循环以nums[i]和以nums[j]为结尾的最长递增子序列都有可能更新

不同的是，指针j的遍历范围是约束在[j,i]之内的

每次遍历完[j,i]之内的所有子序列nums[j]后，才会移动i去扩大区间

详见：单词拆分的遍历过程

3、初始化dp数组

根据dp数组的含义，我们求的是以nums[i]为结尾的最长递增子序列的长度

不管i是多少，其子序列至少包括nums[i]，也就是说长度至少为1

所以dp[i]全部初始化为1即可

4、确定遍历顺序

这里从左往右或者从右往左遍历其实都行

特别注意的一点是最后的返回值

通常我们都是返回dp数组的最后一个值，即dp[nums.size() - 1]

但这里不行

以题目给的示例1来说

示例 1：

输入：nums = [10,9,2,5,3,7,101,18]
输出：4
解释：最长递增子序列是 [2,3,7,101]，因此长度为 4

这里最后遍历到101（即dp[6]）时，取到最长严格递增子序列

显然这不是dp数组的最后一个值

因此我们需要设置一个变量，在循环过程中不断更新最长的子序列长度，最后返回这个最大值

为什么这里最长递增子序列是 [2,3,7,101] 而不可以是 [2,3,7,18]？

实际上确实也可以是后者，但我推测可能是题目中的最长"严格递增"子序列长度做出了限制

代码

class Solution {
public:
    int lengthOfLIS(vector<int>& nums) {
        if (nums.size() <= 1) return nums.size();
        //定义并初始化dp数组
        vector<int> dp(nums.size(), 1);
        //结果变量res
        int res  = 1;//注意，至少长度为1，因此res要初始化为1
        
        //遍历dp数组
        for(int i = 1; i < nums.size(); ++i){
            for(int j = 0; j < i; ++j){//当nums[i] > nums[j]时不断遍历[j,i]范围内的子序列
                if (nums[i] > nums[j]) dp[i] = max(dp[i], dp[j] + 1);
                //不满足条件就移动i扩大范围
            }
            if(dp[i] > res) res = dp[i];//更新更长的子序列长度
        }
        return res;
    }
};

最长连续递增序列

力扣题目链接(opens new window)

给定一个未经排序的整数数组，找到最长且连续递增的子序列，并返回该序列的长度。

连续递增的子序列可以由两个下标 l 和 r（l < r）确定，如果对于每个 l <= i < r，都有 nums[i] < nums[i + 1] ，那么子序列 [nums[l], nums[l + 1], ..., nums[r - 1], nums[r]] 就是连续递增子序列。

示例 1：

输入：nums = [1,3,5,4,7]
输出：3
解释：最长连续递增序列是 [1,3,5], 长度为3。尽管 [1,3,5,7] 也是升序的子序列, 但它不是连续的，因为 5 和 7 在原数组里被 4 隔开。

示例 2：

输入：nums = [2,2,2,2,2]
输出：1
解释：最长连续递增序列是 [2], 长度为1。

提示：

0 <= nums.length <= 10^4
-10^9 <= nums[i] <= 10^9

思路

由题意，与上题最大的不同是这里要求子序列是连续的，不能跳

五步走

1、确定dp数组含义

dp[i]:以下标i为结尾的连续递增的子序列长度为dp[i]

2、确定递推公式

根据题目的条件，连续递增的子序列要满足 nums[i] < nums[i + 1]

也就是说，如果 nums[i] > nums[i - 1]，那么以 i 为结尾的连续递增的子序列长度一定等于以i - 1为结尾的连续递增的子序列长度 + 1

所以递推公式为：dp[i] = dp[i - 1] + 1;

因为本题要求连续递增子序列，所以不用去比较nums[j]与nums[i] （j在0到i之间遍历）

既然不用j了，那么也不用两层for循环，本题一层for循环就行，比较nums[i] 和 nums[i - 1]。

3、初始化dp数组

与上一题一样，dp[i]长度至少为1（即包含本身），因此dp数组初始化为1即可

4、确定遍历顺序

从递推公式看，dp[i]依赖dp[i - 1]，因此应该从前向后遍历

代码

class Solution {
public:
    int findLengthOfLCIS(vector<int>& nums) {
        //处理异常
        if(nums.size() == 0) return 0;
        //定义并初始化dp数组
        vector<int> dp(nums.size(), 1);

        int res = 1;//注意，至少长度为1，因此res要初始化为1
        //遍历dp数组
        for(int i = 1; i < nums.size(); ++i){
            //子序列还满足递增趋势时执行下面的语句
            if(nums[i] > nums[i - 1]) dp[i] = dp[i - 1] + 1;   
            if(dp[i] > res) res = dp[i];
        }
        return res;
    }
};

最长重复子数组

力扣题目链接(opens new window)

给两个整数数组 A 和 B ，返回两个数组中公共的、长度最长的子数组的长度。

示例：

输入：

A: [1,2,3,2,1]
B: [3,2,1,4,7]
输出：3
解释：长度最长的公共子数组是 [3, 2, 1] 。

提示：

1 <= len(A), len(B) <= 1000
0 <= A[i], B[i] < 100

思路

这里要求两个数组中最长重复子数组，其实就是要在两个数组中找到最长的公共子序列

并且这里的子序列应该要求是连续的，也就是和最长连续递增序列的要求类似

所以我们可以仿照着去定义dp数组，但因为涉及两个数组，所以dp数组应该也要是二维的

五步走

1、确定dp数组含义

有两个数组nums1、nums2，那么自然需要两个指针用于遍历，分别是i、j

这两个指针应该是同步移动的，其指向的分别为：nums1和nums1中，当前子数组（子序列）的末尾

如上图所示，指针i、j再往后移一次就不满足重复子数组的条件了，因此上述两个数组的最长重复子数组就是[1,8,3]

dp[i][j]：nums1中以下标为 i - 1 和nums2中以下标为 j - 1 的最长重复子数组长度为dp[i][j]

这里为什么不从i和j开始？要减1呢？

实际上是一个优化技巧，如果从i、j开始，在初始化dp数组时还要单独为dp[i][0]和dp[0][j]进行初始化，但其实这是没有必要的

2、确定递推公式

dp[i][j]的状态是由dp[i - 1][j - 1]推导出来的

正确的理解思路是如下（还是拿上面的图来说）

我们要找的是存在于nums1、nums2中的最长公共子数组

当前i、j下标指向的值之前区间构成的子数组如果是nums1、nums2中公共的（相同的），那么满足条件，dp数组记录当前长度

i、j同时向后移动；如果不相同，dp数组不记录长度（保持为初始值），i、j仍同时向后移动

根据dp数组的定义，dp[i][j]是在下标i - 1 和 j - 1时找到的最长公共子数组的状态

因此，dp[i][j]的前置状态应该也要是找到对应下标下的最长公共子数组的状态，即dp[i - 1][j - 1]，而这两个状态在"数组长度"层面相差1，所以要用dp[i - 1][j - 1]推导出dp[i][j]就要加1

综上，本题的递推公式为: dp[i][j] = dp[i - 1][j - 1] + 1

（其实和上题的分析过程类似）

3、初始化dp数组

这里，因为之前在定义dp数组时，我们选择了从 i - 1 和 j - 1 开始

所以，根据dp数组含义，dp[i][0]和dp[0][j]是没有意义的，因为我们是从 i - 1 和 j - 1 开始找（从i=1，j=1开始遍历），所以没必要初始化这俩

如果从i、j开始，那么dp[i][0]和dp[0][j]就是有意义的，我们需要遍历nums1、nums2来初始化（尽管可能初始化的值很怪）

虽然没有意义，但是肯定还是要有个初始值的，0在合适不过了

即，dp[i][0] = 0、dp[0][j] = 0

其他部分可以初始化为任意值（原因详见），为了统一，也初始化为0

4、确定遍历顺序

从前向后遍历，原因说过很多次了，即i的状态需要根据i - 1推导

然后先遍历nums1、nums2都无所谓（长度一样）

代码

class Solution {
public:
    int findLength(vector<int>& nums1, vector<int>& nums2) {
        // 创建并初始化dp数组
        // vector<vector<int>> dp(nums1.size(), vector<int>(nums2.size(), 0));//错误
        vector<vector<int>> dp(nums1.size() + 1, vector<int>(nums2.size() + 1, 0));

        int res = 0;
        //遍历dp数组
        for(int i = 1; i <= nums1.size(); ++i){//注意边界条件，小于等于
            for(int j = 1; j <= nums2.size(); ++j){//小于等于
                //为了与dp数组的定义保持一致，这里要用i - 1和j - 1为下标进行比较
                if(nums1[i - 1] == nums2[j - 1]) dp[i][j] = dp[i - 1][j - 1] + 1;
                if(dp[i][j] > res) res = dp[i][j];
            }
        }
        return res;
    }
};

注意事项 TBD

最长公共子序列

力扣题目链接(opens new window)

给定两个字符串 text1 和 text2，返回这两个字符串的最长公共子序列的长度。

一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。

例如，"ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。

若这两个字符串没有公共子序列，则返回 0。

示例 1:

输入：text1 = "abcde", text2 = "ace" 输出：3 解释：最长公共子序列是 "ace"，它的长度为 3。

示例 2: 输入：text1 = "abc", text2 = "abc" 输出：3 解释：最长公共子序列是 "abc"，它的长度为 3。

示例 3: 输入：text1 = "abc", text2 = "def" 输出：0 解释：两个字符串没有公共子序列，返回 0。

提示:

1 <= text1.length <= 1000
1 <= text2.length <= 1000 输入的字符串只含有小写英文字符

思路

与上题的区别是，这题又可以使用不连续但符合原有相对顺序的子序列了

开始分析

五步走

1、确定dp数组含义

这里要从两个字符串数组里去找公共子序列，因此仍然需要使用二维dp数组

dp[i][j]:下标为i - 1和j - i时，对于两个数组而言的最长公共子序列的长度为dp[i][j]

（长度为[0, i - 1]的字符串text1与长度为[0, j - 1]的字符串text2的最长公共子序列为dp[i][j]）

为什么要减1？为了避免初始化dp[i][0]和dp[0][j]，详见上一题

2、确定递推公式

因为允许有不连续的子序列，所以这里会有多种情况

（1）如果当前的text1[i] == text2[j]

那没什么好说的，和上题的推导一模一样，dp[i][j] = dp[i - 1][j - 1] + 1

（2）除了相等以外的其他情况

这里用题目给的示例1来说明

屏幕截图 202-27 223612

因为text2就那么长，所以遍历到黑线处就结束了，那就以这个位置举例说明（遍历到前一个位置时分析同理）

需要明确一下，当前情况下，我们是在[a,b,c] (text1)和[a,c,e] (text2) 中找公共子序列

当遍历到如上图中位置时，i指向text1的'c'，j指向text2的'e'，这两个字符显然不相等，因此无法触发情况1

此时有两种情况可以考虑，因为'c'和'e'已经不相等了，那就看其前面一位，看看剩下的还能不能构成公共子序列

情况1：text1退回一位

a b c
  ↑
  i
a c e
    ↑
    j

现在[a,b,c] (text1)和[a,c,e] (text2) 的最长公共子序列长度是1（[a]）

情况2：text2退回一位

a b c
    ↑
    i
a c e
  ↑
  j

由于可以有不连续子序列，所以[a,b,c] (text1)和[a,c,e] (text2) 的最长公共子序列长度是2（[a,c]）

显然，要从这两种情况中取较大的那个

综上，除了text1[i] == text2[j]以外的其他情况时的递推公式是：dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);

因此，本题的递推公式完整写法如下：

if (text1[i - 1] == text2[j - 1]) {
    dp[i][j] = dp[i - 1][j - 1] + 1;
} else {
    dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
}

3、初始化dp数组

首先，空串的子序列长度为0

然后就是text1[i - 1]和text2[j - 1]，上题说过，这俩初始化没有意义，但是还是要给个值，为了统一就给0

然后其他部分可任意初始化，为了统一也给0

4、确定遍历顺序

如上图所示，我们有三个方向可以推到dp[i][j]，因此遍历顺序应该是从前往后，从上到下

（详见二维背包推导）

代码

class Solution {
public:
    int longestCommonSubsequence(string text1, string text2) {
        //定义dp数组并初始化
        vector<vector<int>> dp(text1.size() + 1, vector<int>(text2.size() + 1, 0));

        int res = 0;
        //遍历dp数组
        for(int i = 1; i <= text1.size(); ++i){//注意边界条件，小于等于
            for(int j = 1; j <= text2.size(); ++j){//小于等于
                if(text1[i - 1] == text2[j - 1]){//为了与dp数组的定义保持一致，这里要用i-1和j-1为下标进行比较
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                }else{
                    dp[i][j] = max(dp[i - 1][j], dp[i][j - 1]);
                }
                if(dp[i][j] > res) res = dp[i][j];
            }
        }
        return res;
    }
};

posted @ 2023-04-27 23:21 dayceng 阅读(504) 评论(0) 收藏举报

刷新页面返回顶部

DAYceng

【LeetCode动态规划#14】子序列系列题（最长递增子序列、最长连续递增序列、最长重复子数组、最长公共子序列）

最长递增子序列

思路

五步走

1、2 确定dp数组含义+确定递推公式

3、初始化dp数组

4、确定遍历顺序

代码

最长连续递增序列

思路

五步走

1、确定dp数组含义

2、确定递推公式

3、初始化dp数组

4、确定遍历顺序

代码

最长重复子数组

思路

五步走

1、确定dp数组含义

2、确定递推公式

3、初始化dp数组

4、确定遍历顺序

代码

最长公共子序列

思路

五步走

1、确定dp数组含义

2、确定递推公式

3、初始化dp数组

4、确定遍历顺序

代码

公告