算法55----最长子序列【动态规划】

一、题目:最长公共子序列:

给定两个字符串,求解这两个字符串的最长公共子序列(Longest Common Sequence)。比如字符串L:BDCABA;字符串S:ABCBDAB

则这两个字符串的最长公共子序列长度为4,最长公共子序列是:BCBA

思路:动态规划:时间O(n * m),空间O(n * m)

创建 DP数组C[i][j]:表示子字符串L【:i】和子字符串S【:j】的最长公共子序列个数。

状态方程:

个数代码:

def LCS(L,S):
    if not L or not S:
        return ""
    dp = [[0] * (len(L)+1) for i in range(len(S)+1)]
    for i in range(len(S)+1):
        for j in range(len(L)+1):
            if i == 0 or j == 0:
                dp[i][j] = 0
            else:
                if L[j-1] == S[i-1]:
                    dp[i][j] = dp[i-1][j-1] + 1
                else:
                    dp[i][j] = max(dp[i-1][j],dp[i][j-1])
    return dp[-1][-1]
L = 'BDCABA'
S = 'ABCBDAB'
LCS(L,S)

最长子序列代码:设置一个标志

def LCS(L,S):
    if not L or not S:
        return ""
    res = ''
    dp = [[0] * (len(L)+1) for i in range(len(S)+1)]
    flag = [['left'] * (len(L)+1) for i in range(len(S)+1)]
    for i in range(len(S)+1):
        for j in range(len(L)+1):
            if i == 0 or j == 0:
                dp[i][j] = 0
                flag [i][j] = '0'
            else:
                if L[j-1] == S[i-1]:
                    dp[i][j] = dp[i-1][j-1] + 1
                    flag[i][j] = 'ok'
                else:
                    dp[i][j] = max(dp[i-1][j],dp[i][j-1])
                    flag[i][j] = 'up' if dp[i][j] == dp[i-1][j] else 'left'
    return dp[-1][-1],flag
def printres(flag,L,S):
    m = len(flag)
    n = len(flag[0])
    res = ''
    i , j = m-1 , n-1
    while i > 0 and j > 0:
        if flag[i][j] == 'ok':
            res += L[j-1]
            i -= 1
            j -= 1
        elif flag[i][j] == 'left':
            j -= 1
        elif flag[i][j] == 'up':
            i -= 1
    return res[::-1]            
L = 'BDCABA'
S = 'ABCBDAB'
num,flag = LCS(L,S)
res = printres(flag,L,S)

 

 


二、题目:最长递增子序列

给定一个长度为N的数组,找出一个最长的单调自增子序列(不一定连续,但是顺序不能乱)。例如:给定一个长度为6的数组A{5, 6, 7, 1, 2, 8},则其最长的单调递增子序列为{5,6,7,8},长度为4.

解法一:最长公共子序列:O(N^2)

这个问题可以转换为最长公共子序列问题。如例子中的数组A{5,6, 7, 1, 2, 8},则我们排序该数组得到数组A‘{1, 2, 5, 6, 7, 8},然后找出数组A和A’的最长公共子序列即可。显然这里最长公共子序列为{5, 6, 7, 8},也就是原数组A最长递增子序列。

解法二:动态规划法(时间复杂度O(N^2))

 设 dp(j) 表示L中以 L[j] 为末元素的最长递增子序列的长度。状态方程:

dp(j) = { max(dp(i)) + 1, i<j且L[i]<L[j] }

这个递推方程的意思是,在求以L【j】为末元素的最长递增子序列时,找到所有序号在 j 前面且小于L【j】的元素L【i】,即 i < j 且 L【j】< L【i】。

例如给定的数组为{5,6,7,1,2,8},则 dp(0)=1, dp(1)=2, dp(2)=3, dp(3)=1, dp(4)=2, dp(5)=4。所以该数组最长递增子序列长度为4,序列为{5,6,7,8}。

代码:

def LCS1(L):
    if not L:
        return ""
    dp = [1] * len(L)
    for j in range(len(L)):
        for i in range(j):
#当j = 5,i = 0时,dp = [1,2,3,1,2,1]
#当j = 5,i = 0时,dp[5] = 1 < dp[0]+1,故dp(5)更新为dp[0]+1=2,
#当j = 5,i = 1时,dp[5] = 2 < dp[1]+1 =3,故dp(5)更新为dp[1]+1=3
#当j = 5,i = 2时,dp[5] = 4
#当j = 5,i = 3时,dp[5] = 4 > dp[3]+1 = 3,故dp[5]不更新,同理,i = 4时,dp[5]仍等于4
if L[j] > L[i] and dp[j] < dp[i] + 1:
dp[j]
= dp[i]+1 return max(dp) L = [5,6,7,1,2,8] LCS1(L)

得到dp数组之后找出,最长递增子序列,

  • 先找到dp最大值5,索引为7,然后arr【7】= 9
  • dp【6】 = 5-1 =4,故arr【6】=8
  • dp【4】 = 4-1或者dp【5】 = 4-1,故arr【4】 = 6 / arr【5】=4
  • dp 【2】=3-1或者dp【3】 = 3-1,故arr【2】 = 5 / arr【3】=3
  • 2 / 1

故最长递增子序列:2→5→6→8→9或者1→3→4→8→9

 

解法三:优化的动态规划,时间O(NlogN),空间效率最坏情况也是O(n),

5 9 4 1 3 7 6 7 2

那么:dp为以下情况,

5 //加入
5 9 //加入
4 9 //用4代替了5
1 9 //用1代替4
1 3 //用3代替9
1 3 7 //加入
1 3 6 //用6代替7
1 3 6 7 //加入

1 2 6 7 //用2代替3

该dp=【1,2,6,7】数组理解为到目前为止长度为1的递增子序列末尾最小为1,长度为2的递增子序列末尾最小为2,长度为3的递增子序列末尾最小为6,长度为4的递增子序列末尾最小为7.

而2代替3是找到比刚好2大的数3,这个查找过程通过二分查找,故时间复杂度为二分查找的O(NlogN)

最后b中元素的个数就是最长递增子序列的大小,即4。

要注意的是最后数组里的元素并不就一定是所求的序列,

例如如果输入 2 5 1

那么最后得到的数组应该是 1 5

而实际上要求的序列是 2 5

 

进阶题目:二维数组的最长递增子序列(生日礼物(京东2016实习生真题))

把卡片套装在一系列的信封A = {a1,  a2,  ...,  an}中。小东已经从商店中购买了很多的信封,她希望能够用手头中尽可能多的信封包装卡片。为防止卡片或信封被损坏,只有长宽较小的信封能够装入大些的信封,同尺寸的信封不能套装,卡片和信封都不能折叠。

解题思路:

  我们首先定义一个结构体,存放信封的长,宽,及其索引位置,然后把不能装卡片的信封去除掉(长宽较小的), 然后根据长或宽进行一个排序,这样就可以转化成一个最长递增子序列问题来求解了,2层循环动态规划就很容易求解了。


三、题目:最长递增子序列个数

 

给定一个未排序的整数数组,找到最长递增子序列的个数。

示例 1:

输入: [1,3,5,4,7]
输出: 2
解释: 有两个最长递增子序列,分别是 [1, 3, 4, 7] 和[1, 3, 5, 7]。

示例 2:

输入: [2,2,2,2,2]
输出: 5
解释: 最长递增子序列的长度是1,并且存在5个子序列的长度为1,因此输出5。

注意: 给定的数组长度不超过 2000 并且结果一定是32位有符号整数。

思路:动态规划,时间O(n2),空间O(n2)

定义 dp(n,1) count (n,1) 

用dp[i]表示以nums[i]为结尾的递推序列的长度,

用cnt[i]表示以nums[i]为结尾的递推序列的个数,

初始化都赋值为1,只要有数字,那么至少都是1。

状态方程:

if nums[i] > nums[j] and dp[i] == dp[j] :
       dp[i] = dp[j]+1

  count[i]  = count[j]

elif nums[i] > nums[j] and dp[i] == dp[j]+1:

  count[i] += count[j]

代码:

def findNumberOfLIS(nums):
    # dp solution, 2 arrays
    # dp[i] stores the longest length ending at nums[i]
    # count[i] counts the number of paths with length dp[i]
    if not nums:
        return 0

    n = len(nums)
    dp = [1] * n
    count  = [1] * n

    for i in range(1, n):
        for j in range(i):
            if nums[i] > nums[j]:
                # dp[i] = max(dp[j]+1, dp[i]) 
                # but we need to compute count also
                if dp[i] == dp[j]:
                    dp[i] = dp[j]+1
                    count[i]  = count[j]
                elif dp[i] == dp[j]+1:
                    count[i] += count[j]

    maxLength = max(dp)
    return sum([count[i] for i in range(n) if dp[i] == maxLength])
nums = [1,3,5,4,6]
findNumberOfLIS(nums)

 


四、题目:最大连续子序列(子串)

最大子序列是要找出由数组成的一维数组中和最大的连续子序列。比如{5,-3,4,2}的最大子序列就是 {5,-3,4,2},它的和是8,达到最大;而 {5,-6,4,2}的最大子序列是{4,2},它的和是6。你已经看出来了,找最大子序列的方法很简单,只要前i项的和还没有小于0那么子序列就一直向后扩展,否则丢弃之前的子序列开始新的子序列,同时我们要记下各个子序列的和,最后找到和最大的子序列。

import copy
def maxSubSum(arr):
    if not arr:
        return 0
    maxSum,curSum = 0,0
    SubList,curlist = [],[]
    for i in range(len(arr)):
        if curSum + arr[i] > 0:
            curSum += arr[i]
            maxSum = curSum
            curlist.append(arr[i])
            SubList = copy.deepcopy(curlist)
        else:
            curSum = 0
            curlist = []
    return maxSum,SubList
arr = [5,-6,4,2,-1,3,-9]
maxSubSum(arr)

五、题目:最长公共子串

找出两个字符串最长连续的公共字符串,如两个母串cnblogs和belong,最长公共子串为lo

思路:动态规划:时间O(N*M),空间O(N*M)

将二维数组c[i][j]用来记录具有这样特点的子串——结尾同时也为子串x1x2⋯xi与y1y2⋯yj的结尾的长度。

代码:

def lcs(s1,s2):
    if not s1 or not s2:
        return 0
    c = [[0] * len(s2) for i in range(len(s1))]
    result = 0
    for i in range(len(s1)):
        for j in range(len(s2)):
            if i == 0 or j == 0:
                c[i][j] = 0
            else:
                if s1[i-1] == s2[j-1]:
                    c[i][j] = c[i-1][j-1] + 1
                    result = max(c[i][j],result)
                else:
                    c[i][j] = 0
    return result
s1 = 'cnblogs'
s2 ='belong'
lcs(s1,s2)

 


六、题目:最长公共子序列(3个字符串)

设A、B、C是三个长为n的字符串,它们取自同一常数大小的字母表。设计一个找出三个串的最长公共子序列的O(n^3)的时间算法。
       思路:跟上面的求2个字符串的公共子序列是一样的思路,只不过这里需要动态申请一个三维的数组,三个字符串的尾字符不同的时候,考虑的情况多一些而已。

七、题目:判断s是否为t的子序列:

给定字符串 st ,判断 s 是否为 t 的子序列。

你可以认为 st 中仅包含英文小写字母。字符串 t 可能会很长(长度 ~= 500,000),而 s 是个短字符串(长度 <=100)。

字符串的一个子序列是原始字符串删除一些(也可以不删除)字符而不改变剩余字符相对位置形成的新字符串。(例如,"ace""abcde"的一个子序列,而"aec"不是)。

示例 1:
s = "abc", t = "ahbgdc"

返回 true.

示例 2:
s = "axc", t = "ahbgdc"

返回 false.

后续挑战 :

如果有大量输入的 S,称作S1, S2, ... , Sk 其中 k >= 10亿,你需要依次检查它们是否为 T 的子序列。在这种情况下,你会怎样改变代码?

 

思路:动态规划:dp[i]表示:s[i] 是否在t中,在则True,不在则False。

初始化:dp = [False] * len(s)

状态方程:if s[i] == t[j],则dp[i] = True, i+=1,j += 1,否则,j+=1【继续找,直到找到t的尾部】

代码:

    def isSubsequence(self, s, t):
        """
        :type s: str
        :type t: str
        :rtype: bool
        """
        if not s:
            return True
        if not t or len(s) > len(t):
            return False
        i , j = 0 , 0
        dp = [False] * len(s)
        while i < len(s) and j < len(t):
            if s[i] == t[j]:
                dp[i] = True
                i += 1
                j += 1
            else:
                j += 1
        return all(dp)

八、题目:平方串

如果一个字符串S是由两个字符串T连接而成,即S = T + T, 我们就称S叫做平方串,例如"","aabaab","xxxx"都是平方串.
牛牛现在有一个字符串s,请你帮助牛牛从s中移除尽量少的字符,让剩下的字符串是一个平方串。换句话说,就是找出s的最长子序列并且这个子序列构成一个平方串。

思路:动态规划:时间O(n^3),空间O(n^2)

首先将字符串s分为s1和s2,求s1和s2最长公共子序列。

拆分s1和s2有n种,如s = ‘ frankfurt',一、s1 = 'f',s2='rankfurt'。二、s1 ='fr',s2 = ’ankfurt‘……

故该方法时间复杂度为n3

 代码:

def test():
    s = input()
    res = 0
    for i in range(len(s)-1):
        res = max(res,lcs(s,i))
    return 2*res
def lcs(s,i):
    s1 = s[:i+1]
    s2 = s[i+1:]
    dp = [[0] * (len(s2)+1) for i in range(len(s1)+1)]
    for i in range(1,len(s1)+1):
        for j in range(1,len(s2)+1):
            if s1[i-1] == s2[j-1]:
                dp[i][j] = dp[i-1][j-1] + 1
            else:
                dp[i][j] = max(dp[i-1][j],dp[i][j-1])
    return dp[-1][-1]
if __name__ == '__main__':
    print(test())

 九、题目:乘积最大子序列

给定一个整数数组 nums ,找出一个序列中乘积最大的连续子序列(该序列至少包含一个数)。

示例 1:

输入: [2,3,-2,4]
输出: 6
解释: 子数组 [2,3] 有最大乘积 6。

示例 2:

输入: [-2,0,-1]
输出: 0
解释: 结果不能为 2, 因为 [-2,-1] 不是子数组。

思路:设置两个变量,一个存储当前最大值,一个存储最小值。

访问到每个点的时候,以该点为子序列的末尾的乘积,要么是该点本身,要么是该点乘以以前一点为末尾的序列,注意乘积负负得正,故需要记录前面的最大最小值。

代码:

def test(nums):
    if not nums:
        return 0
    minnum = nums[0]
    maxnum = nums[0]
    res = nums[0]
    for i in range(1,len(nums)):
        minnum = min([nums[i],minnum*nums[i],maxnum*nums[i]])
        maxnum = max([nums[i],maxnum*nums[i],minnum*nums[i]])
        res = max(res,maxnum)
    return res
nums = [2,3,-2,4]
test(nums)

 

posted on 2018-11-17 21:53  吱吱了了  阅读(8488)  评论(0编辑  收藏  举报

导航