动态归划之编辑距离

# -*- encoding : utf-8 -*-
# @Author : 日落了
# @ Motto : 天不生python,IT 万古如长夜
# @project_name : DUOyi
# @Time : 2021/12/29
# @description : 编辑距离
"""
输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

"""


# 可读性更强
def mindistance(word1, word2):
    m = len(word1)
    n = len(word2)
    # 二维数组 为什么要 + 1; 为什么要使用二维数组
    # +1 是为了在递推的过程中不爆栈
    # dp[i][j] 表示word1[i]变成word2[j]的时候使用的最小的步数的数量
    dp = [[0 for col in range(n + 1)] for row in range(m + 1)]
    # 当word1有i个数需要delete i 个数变成word2中的 j = 0
    for i in range(m + 1):
        dp[i][0] = i
    # 同上 同理
    for j in range(n + 1):
        dp[0][j] = j
    # 老框架了 就是一个递推
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            # 当数位上的字符相等的时候,就躺赢什么都不用做 直接等于之前的那个dp就行
            if word1[i-1] == word2[j-1]:
                dp[i][j] = dp[i - 1][j - 1]
        else:
            # 这里是 插入,删除,替换的操作
            '''
            dp[i - 1][j] 删除,因为dp[i][j]多余了一个word[i]
            dp[i][j-1] 插入 见上同理可得 ,需要插入一个数才能变成word[j],因此 j++
            dp[i-1][j-1]  替换需要将word1[i] 变成 word2[j] 才能实现dp[i][j], i,j 需要同时前进一位       
            '''
            dp[i][j] = min(dp[i - 1][j], dp[i][j - 1], dp[i - 1][j - 1]) + 1
    return dp[m][n]


def mindistance1(word1, word2):
    m = len(word1)
    n = len(word2)
    dp = [[0 for col in range(n + 1)] for row in range(m + 1)]
    for i in range(m + 1):
        dp[i][0] = i
    for j in range(n + 1):
        dp[0][j] = j
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            dp[i][j] = min(dp[i - 1][j - 1] + (0 if word1[i - 1] == word2[j - 1] else 1), dp[i][j - 1] + 1,
                           dp[i - 1][j] + 1)
    return dp[m][n]


if __name__ == '__main__':
    print(mindistance1('horse', 'ros'))

 

posted @ 2021-12-30 01:24  pie神  阅读(60)  评论(0编辑  收藏  举报