动态规划之LeetCode第72题(编辑距离)

  首先先学习一个经典的算法吧,就是和本题一模一样的“编辑距离算法”。编辑距离,Minimum Edit Distance,简称MED,是俄罗斯科学家 Vladimir Levenshtein 在1965年提出,也因此而得名 Levenshtein Distance。用来度量两个序列相似程度的指标。通俗地来讲,编辑距离指的是在两个单词<w1,w2>之间,由其中一个单词w1转换为另一个单词w2所需要的最少单字符编辑操作次数。其中,单字符编辑操作有且仅有三种:

  1.插入

  2.删除

  3.替换

  关于这个算法,还有一个比较正规的数学形式定义:

  我们将两个字符串a,b的 Levenshtein Distance 表示为 leva,b(|a|,|b|),其中|a|和 |b|分别对应a,b 的长度。那么,在这里两个字符串 a,b的 Levenshtein Distance,

即leva,b(|a|,|b|)可用如下的数学语言描述:

  

 

  • 定义 lev_{a,b}(i, j) 指的是 ai 个字符bj 个字符之间的距离。为了方便理解,这里的i,j可以看作是a,b的长度。这里的字符串的第一个字符 index 从 1 开始(实际因为在表上运算的时候字符串前需要补 0),因此最后的编辑距离便是 i = |a|, j = |b| 时的距离: lev_{a,b}(|a|, |b|)
  • min(i, j) = 0 的时候,对应着字符串ai 个字符和 字符串bj 个字符,此时的 i,j 有一个值为 0 ,表示字符串 a 和 b 中有一个为空串,那么从 a 转换到 b 只需要进行max(i, j)次单字符编辑操作即可,所以它们之间的编辑距离为 max(i, j),即 i, j 中的最大者。
  • 当 min(i, j) \ne 0 的时候,lev_{a,b}(|a|, |b|) 为如下三种情况的最小值:
    1.lev_{a,b}(i-1, j) + 1 表示 删除 a_i
    2.lev_{a,b}(i, j-1) + 1 表示 插入 b_j
    3.lev_{a,b}(i-1, j-1)+1_{(a_i \ne b_j)} 表示 替换 b_j
  • 1_{(a_i \ne b_j)} 为一个指示函数,表示当 a_i = b_j 的时候取 0 ;当 a_i \ne b_j 的时候,其值为 1。

 

题目:给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。你可以对一个单词进行如下三种操作:

  1.插入一个字符
  2.删除一个字符
  3.替换一个字符

分析:根据上面的“编辑距离算法”我们自然而然的就会想到使用动态规划来解决这个题目,

  1.定义一个数组二维dp,dp[i][j]表示字符串word1中前i个字符和word2中前j个字符之间的距离,此处的i、j可以看作word1和word2的这两个字符串的长度;

  2.根据上面的算法,我们可以得出dp的元素之间的关系式,即:

    if min(i,j) ==0, 那么 dp[i][j] = max(i,j);

    if min(i,j) != 0,那么

        if word1[i] == word2[j],那么dp[i][j] = min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1])

        if word1[i] != word2[j],那么dp[i][j] = min(dp[i-1][j]+1,dp[i][j-1]+1,dp[i-1][j-1]+1)

最终,dp[|word1|][|word|2]即为所求的最小值。

    public int minDistance(String word1, String word2) {
        if (Math.min(word1.length(),word2.length())==0)
            return Math.max(word1.length(),word2.length());
        int m = word1.length();
        int n = word2.length();
        int[][] dp = new int[m+1][n+1];
        for (int i = 1; i <= m; i++) {
            dp[i][0] = i;
        }
        for (int j = 1; j <= n; j++) {
            dp[0][j] = j;
        }
        for (int i = 1; i <= m; i++) {
            for (int j = 1;j <= n;j ++){
                if (word1.charAt(i-1) == word2.charAt(j-1)){
                    dp[i][j] = Math.min(Math.min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]);
                }else {
                    dp[i][j] = Math.min(Math.min(dp[i-1][j]+1,dp[i][j-1]+1),dp[i-1][j-1]+1);
                }
            }
        }
        return dp[m][n];
    }

题目来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/edit-distance

编译距离算法参考自:
链接:https://www.jianshu.com/p/a617d20162cf

posted @ 2020-04-02 20:47  有心有梦  阅读(372)  评论(0编辑  收藏  举报