最长公共子序列——动态规划

关于最长公共子序列（LCS）

最长公共子序列和最长公共子串是有区别的，之前我一直把它们混淆。

最长公共子串举例：假设S1={A,D,C,B,E,X,Q}，S2={H,P,D,C,B,E,M,L}
那么它们的最长公共子串就是{D,C,B,E}。这是我通常理解的东西。

最长公共子序列。

最长公共子序列举例：假设S1={A,B,C,A,D,A,B}，S2={B,A,C,D,B,A}，那么它们的LCS就是{B,A,D,B}。

求解最长公共子序列

这是一个动态规划问题。如何求解最长公共子序列（以下用LCS代替）呢？我们假设已经知道Z={z1,z2,...zk}是X={x1,x2,...,xm}和Y={y1,y2,...,yn}的LCS，那么可以分以下三种情况讨论（具体每种情况证明不再累述）：

xm=yn=zk：那么Zk-1是Xm-1和Yn-1的LCS。
xm≠yn，yn≠zk：我们可以把yn去掉，那么Zk是Xm和Yn-1的LCS。
xm≠yn，xm≠zk：我们可以把xm去掉，那么Zk是Xm-1和Yn的LCS。

基于以上情况，我们可以得到LCS递归式。我们假设ci表示Xi和Yi的LCS长度，那么：

ci=0(i=0或j=0)；
ci=c[i-1]c[j-1]+1(i,j>0且xi=yi）；
ci=max{ci-1,c[i],[j-1]}；（i,j>0且xi≠yi）。

这样我们就可以得到LCS的长度。如何得到具体内容是什么呢？我们可以借用一个辅助数组bi，这个数组用来记录ci的来源，分别有如下情况：

ci=ci-1+1，则bi=1；
ci=ci，则bi=2；
ci=ci-1，则bi=3。

这样就可以根据bm反向追踪LCS，当bi=1，输出xi；当bi=2，追踪ci；当bi=3，追踪ci-1，直到i=0或j=0停止。

算法设计

（1）初始化。初始化c[][]第1行和第1列为0。
（2）开始操作。具体是将s1[i]分别与s2[j-1]（j=1,2,...,len2）进行比较，若字符相等ci=左上角数值+1，且bi=1；若不相等，则ci等于左侧或者上侧重最大的一个数值，若左侧和上侧相等，则取左侧，且bi=2或3（当取左侧为2，取上侧为3）。最后的c[][]和b[][]如下所示：
下表是c[][]：

	1	2	3	4	5	6
	0	0	0	0	0	0
A	0	1	1	1	1	1
B	1	1	1	1	2	2
C	1	1	2	2	2	2
A	1	2	2	2	2	3
D	1	2	2	3	3	3
A	1	2	2	3	3	4
B	1	2	2	3	4	4

下表是b[][]：

	1	2	3	4	5	6
	0	0	0	0	0	0
1	2	1	2	2	2	1
2	1	2	2	2	1	2
3	3	2	1	2	2	2
4	3	1	2	2	2	1
5	3	3	2	1	2	2
6	3	1	2	3	2	1
7	1	3	2	3	1	2

根据c[][]可以得出，LCS的长度为4（也就是c[][]最后一个值）。然后开始判断内容是什么，这是要根据b[][]来。
首先，b7=2，向左找b7=1，所以向左上角找b6，得到字母为s1[6]=[B]；
b6=3，向上找b5=1，向左上角找b4，得到字母s1[4]=[D]；
b4=2，向左找b4[1]，得到字母s1[3]=[A]；
b3=3，向上找b2=1，向左上角找b1，得到字母s1[1]=[B].
由于b1=0，所以算法停止，返回结果为“BADB”。

 1 int CommonOrder(char x[], int m, char y[], int n, char z)
 2 {   
 3     int maxsize = 1000;
 4     int i, j, k;
 5     int L[maxsize], S[maxsize];
 6     for(j = 0; j < n; ++j){
 7         L[0][j] = 0;
 8     }
 9     for(i = 0, i < m; ++i)
10     {
11         L[i][0] = 0;
12     }
13     for(i = 1; i <= m; ++i)
14     {
15         for(j = 1; j <= n; ++j)
16         {
17             if(x[i] == y[j])
18             {
19                 L[i][j] = L[i-1][j-1] +1;
20                 S[i][j] = 1;
21             }
22             else if(L[i][j-1] >= L[i-1][j])
23             {
24                 L[i][j] = L[i][j-1];
25                 S[i][j] = 2;
26             }
27             else
28             {
29                 L[i][j] = L[i-1][j];
30                 S[i][j] = 3;
31             }
32             
33         }
34     }
35     k = L[m][n];
36     while(m > 0 && n > 0)
37     {
38         if(S[m][n] == 1)
39         {
40             z[k] = x[i];
41             --k;
42             --m;
43             --n;
44         }
45         else if(S[m][n] == 1) --n;
46         else --m;
47     }
48     for(k = 0; k < L[m][n]; ++k)
49     {
50         cout<<z[k];
51     }
52     return L[m][n];
53 }

posted @ 2019-05-22 17:06 unique_ptr 阅读(169) 评论(0) 收藏举报

刷新页面返回顶部

后台开发学习

后台开发学习

最长公共子序列——动态规划

关于最长公共子序列（LCS）

求解最长公共子序列

算法设计

公告

	1	2	3	4	5	6
	0	0	0	0	0	0
A	0	1	1	1	1	1
B	1	1	1	1	2	2
C	1	1	2	2	2	2
A	1	2	2	2	2	3
D	1	2	2	3	3	3
A	1	2	2	3	3	4
B	1	2	2	3	4	4

	1	2	3	4	5	6
	0	0	0	0	0	0
1	2	1	2	2	2	1
2	1	2	2	2	1	2
3	3	2	1	2	2	2
4	3	1	2	2	2	1
5	3	3	2	1	2	2
6	3	1	2	3	2	1
7	1	3	2	3	1	2

	1	2	3	4	5	6
	0	0	0	0	0	0
A	0	1	1	1	1	1
B	1	1	1	1	2	2
C	1	1	2	2	2	2
A	1	2	2	2	2	3
D	1	2	2	3	3	3
A	1	2	2	3	3	4
B	1	2	2	3	4	4

	1	2	3	4	5	6
	0	0	0	0	0	0
1	2	1	2	2	2	1
2	1	2	2	2	1	2
3	3	2	1	2	2	2
4	3	1	2	2	2	1
5	3	3	2	1	2	2
6	3	1	2	3	2	1
7	1	3	2	3	1	2

	1	2	3	4	5	6
	0	0	0	0	0	0
A	0	1	1	1	1	1
B	1	1	1	1	2	2
C	1	1	2	2	2	2
A	1	2	2	2	2	3
D	1	2	2	3	3	3
A	1	2	2	3	3	4
B	1	2	2	3	4	4

	1	2	3	4	5	6
	0	0	0	0	0	0
1	2	1	2	2	2	1
2	1	2	2	2	1	2
3	3	2	1	2	2	2
4	3	1	2	2	2	1
5	3	3	2	1	2	2
6	3	1	2	3	2	1
7	1	3	2	3	1	2