LIS/LCS/LCIS
1.最长上升子序列
2.最长公共子序列
对于两个序列X={x1,x2,x3...xi ...},Y={y1,y2,y3... yi...}
3.最长上升公共子序列
以下摘自刘汝佳《最长公共上升子序列(LCIS)的O(n^2)算法》
预备知识:动态规划的基本思想,LCS,LIS。
问题:字符串a,字符串b,求a和b的LCIS(最长公共上升子序列)。
首先我们可以看到,这个问题具有相当多的重叠子问题。于是我们想到用DP搞。DP的首要任务是什么?定义状态。
定义状态F[i][j]表示以a串的前i个字符b串的前j个字符且以b[j]为结尾构成的LCIS的长度。
为什么是这个而不是其他的状态定义?最重要的原因是我只会这个,还有一个原因是我知道这个定义能搞到平方的算法。而我这只会这个的原因是,这个状态定义实在是太好用了。这一点我后面再说。
我们来考察一下这个这个状态。思考这个状态能转移到哪些状态似乎有些棘手,如果把思路逆转一下,考察这个状态的最优值依赖于哪些状态,就容易许多了。这个状态依赖于哪些状态呢?
首先,在a[i]!=b[j]的时候有F[i][j]=F[i-1][j]。为什么呢?因为F[i][j]是以b[j]为结尾的LCIS,如果F[i][j]>0那么就说明a[1]..a[i]中必然有一个字符a[k]等于b[j](如果F[i][j]等于0呢?那赋值与否都没有什么影响了)。因为a[k]!=a[i],那么a[i]对F[i][j]没有贡献,于是我们不考虑它照样能得出F[i][j]的最优值。所以在a[i]!=b[j]的情况下必然有F[i][j]=F[i-1][j]。这一点参考LCS的处理方法。
那如果a[i]==b[j]呢?首先,这个等于起码保证了长度为1的LCIS。然后我们还需要去找一个最长的且能让b[j]接在其末尾的LCIS。之前最长的LCIS在哪呢?首先我们要去找的F数组的第一维必然是i-1。因为i已经拿去和b[j]配对去了,不能用了。并且也不能是i-2,因为i-1必然比i-2更优。第二维呢?那就需要枚举b[1]..b[j-1]了,因为你不知道这里面哪个最长且哪个小于b[j]。这里还有一个问题,可不可能不配对呢?也就是在a[i]==b[j]的情况下,需不需要考虑F[i][j]=F[i-1][j]的决策呢?答案是不需要。因为如果b[j]不和a[i]配对,那就是和之前的a[1]..a[j-1]配对(假设F[i-1][j]>0,等于0不考虑),这样必然没有和a[i]配对优越。(为什么必然呢?因为b[j]和a[i]配对之后的转移是max(F[i-1][k])+1,而和之前的i`配对则是max(F[i`-1][k])+1。显然有F[i][j]>F[i`][j],i`>i)
于是我们得出了状态转移方程:
a[i]!=b[j]: F[i][j]=F[i-1][j]
a[i]==b[j]: F[i][j]=max(F[i-1][k])+1 1<=k<=j-1&&b[j]>b[k]
不难看到,这是一个时间复杂度为O(n^3)的DP,离平方还有一段距离。
但是,这个算法最关键的是,如果按照一个合理的递推顺序,max(F[i-1][k])的值我们可以在之前访问F[i][k]的时候通过维护更新一个max变量得到。怎么得到呢?首先递推的顺序必须是状态的第一维在外层循环,第二维在内层循环。也就是算好了F[1][len(b)]再去算F[2][1]。
如果按照这个递推顺序我们可以在每次外层循环的开始加上令一个max变量为0,然后开始内层循环。当a[i]>b[j]的时候令max=F[i-1][j]。如果循环到了a[i]==b[j]的时候,则令F[i][j]=max+1。
最后答案是F[len(a)][1]..F[len(a)][len(b)]的最大值。
参考代码:
#include<cstdio> #include<cstring> int f[1005][1005],a[1005],b[1005],i,j,t,n1,n2,max; int main() { scanf("%d",&t); while(t--) { scanf("%d%d",&n1,&n2); for(i=1;i<=n1;i++) scanf("%d",&a[i]); for(i=1;i<=n2;i++) scanf("%d",&b[i]); memset(f,0,sizeof(f)); for(i=1;i<=n1;i++) { max=0; for(j=1;j<=n2;j++) { f[i][j]=f[i-1][j]; if (a[i]>b[j]&&max<f[i-1][j]) max=f[i-1][j]; if (a[i]==b[j]) f[i][j]=max+1; } } max=0; for(i=1;i<=n2;i++) if (max<f[n1][i]) max=f[n1][i]; printf("%d\n",max); } }
4.最大子序和
(1)改进的穷举法O(n^2)
int MaxSubSum(int *arr, int n) { int MaxSum = 0, ThisSum; for(int i = 0; i < n; i++) { ThisSum = 0; // ThisSum减少了O(n^3)中的重复计算 for(int j = i; j < n; j++) { ThisSum += arr[j]; MaxSum = max(MaxSum, ThisSum); } } return MaxSum; }
(2)分治法O(nlogn)
#include <stdio.h> #include <iostream> using namespace std; int MaxSubSum(int *arr, int left, int right) { if(left == right) return (arr[left] < 0) ? 0 : arr[left]; int LMaxSum, RMaxSum, CMaxSum; int center = (left + right) / 2; LMaxSum = MaxSubSum(arr, left, center); RMaxSum = MaxSubSum(arr, center+1, right); // 左部包含右端结点的最长子序列 int LLMaxSum = 0, LLThisSum = 0; for(int i = center; i >= left; i--) { LLThisSum += arr[i]; LLMaxSum = max(LLMaxSum, LLThisSum); } // 右部包含左端结点的最长子序列 int RRMaxSum = 0, RRThisSum = 0; for(int i = center+1; i <= right; i++) { RRThisSum += arr[i]; RRMaxSum = max(RRMaxSum, RRThisSum); } // 跨越左右两部分的最长子序列 CMaxSum = LLMaxSum + RRMaxSum; return max(max(LMaxSum, RMaxSum), CMaxSum); } int main() { int arr[12] = {-6, 2, 4, -7, 5, 3, 2, -1, 6, -9, 10, -2}; printf("ans = %d\n", MaxSubSum(arr, 0, 11)); }
(3)动态规划法O(n)
int MaxSubSum(int *arr, int n) { int MaxSum = 0, ThisSum = 0; for(int i = 0; i < n; i++) { ThisSum += arr[i]; if(ThisSum < 0) // 说明此段不可能作为最大上升子序列的前缀 ThisSum = 0; MaxSum = max(MaxSum, ThisSum); // 但此段中出现的最大上升子序列对结果可能有影响 } return MaxSum; }