动态规划最长公共子序列

最长公共子序列（LCS）问题

下面通过一个具体的例子来学习动态规划方法 —— 最长公共子序列问题。

最长公共子串（Longest Common Substring）与最长公共子序列（Longest Common Subsequence）的区别：子串要求在原字符串中是连续的，而子序列则只需保持相对顺序，并不要求连续。

问题描述：给定两个序列：X[1...m]和Y[1...n]，求在两个序列中同时出现的最长子序列的长度。

假设 X 和 Y 的序列如下：

　　　　　　X[1...m] = {A, B, C, B, D, A, B}

　　　　　　Y[1...n] = {B, D, C, A, B, A}

可以看出，X 和 Y 的最长公共子序列有 “BDAB”、“BCAB”、“BCBA”，即长度为4。

1）穷举法

可能很多人会想到用穷举法来解决这个问题，即求出 X 中所有子序列，看 Y 中是否存在该子序列。

　　X 有多少子序列 ——

　　检查一个子序列是否在 Y 中 —— θ(n)

所以穷举法在最坏情况下的时间复杂度是

2）动态规划

首先，我们来看看 LCS 问题是否具有动态规划问题的两个特性。

① 最优子结构

设 C[i,j] = |LCS(x[1...i],y[1...j])|，即C[i,j]表示序列X[1...i]和Y[1...j]的最长公共子序列的长度，则 C[m,n] = |LCS(x,y)|就是问题的解。

递归推导式：

根据上面的递归推导式，可以写出求LCS长度的递归伪代码：

LCS(x,y,i,j)
	if x[i] = y[j]
		then C[i,j] ← LCS(x,y,i-1,j-1)+1
		else C[i,j] ← max{LCS(x,y,i-1,j),LCS(x,y,i,j-1)}
	return C[i,j]

动态规划就是要解决这个问题，通过用一个表来保存子问题的结果，避免重复的计算，以空间换时间。前面我们已经证明，最长公共子序列问题具有动态规划所要求的两个特性，所以 LCS 问题可以用动态规划来求解。

下面是用动态规划（打表）解决LCS问题：

private static int lcs(char[] x, char[] y, int m, int n) {
		if (m == 0 || n == 0) {
			return 0;
		}
		int[][] c = new int[m + 1][n + 1];
		for (int i = 1; i < m + 1; i++) {
			for (int j = 1; j < n + 1; j++) {
				if (x[i - 1] == y[j - 1]) {
					c[i][j] = c[i - 1][j - 1] + 1;
				} else {
					c[i][j] = Math.max(c[i][j - 1], c[i - 1][j]);
				}
			}
		}
		return c[m][n];
	}

posted @ 2017-05-30 10:20 李白说故事阅读(448) 评论(0) 收藏举报

刷新页面返回顶部

动态规划 最长公共子序列

最长公共子序列（LCS）问题

公告

动态规划最长公共子序列