51nod 1183 编辑距离【线性dp+类似最长公共子序列】
1183 编辑距离
基准时间限制:1 秒 空间限制:131072 KB 分值: 0 难度:基础题
收藏
关注
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
例如将kitten一字转成sitting:
sitten (k->s)
sittin (e->i)
sitting (->g)
所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
给出两个字符串a,b,求a和b的编辑距离。
Input
第1行:字符串a(a的长度 <= 1000)。
第2行:字符串b(b的长度 <= 1000)。
Output
输出a和b的编辑距离
Input示例
kitten
sitting
Output示例
3
【分析】:
设dp[i][j]代表a字符串前i个变形 b字符串前j个最小操作步数;
此题类型和求两字符串最长公共子序列有相同部分,但最长公共序列对相同字符位置没有要求,但在此题中则是解题关键,
若两位置相同,则不需任何操作,但若两相同部分之间相错n位,则需增加n次操作,同时还要考虑最优解;
同时dp[i][0]=dp[0][i]=i;
(1) 必须 S[i] == T[j], 这时前i – 1和j – 1位都已经对齐了,这部分肯定要最少扣分。这种情况下最少的扣分是dp(i-1,j-1)
(2) 和(1)类似,S[i]≠T[j],这种情况下最少的扣分是dp(i - 1, j – 1) + 1
(3) S的前i位和T的前(j – 1)位已经对齐了,这部分扣分也要最少。这种情况下最少的扣分是dp(i, j - 1) + 1
(4) S的前(i - 1)位已经和T的前j位对齐了,这部分扣分要最少。这种情况下最少的扣分是dp(i - 1, j) + 1
这样就能得到状态转移方程:
dp(i,j) = min(dp(i – 1, j – 1) + ( S[i] == T[j] ? 0:1 ), dp(i – 1,j ) + 1, dp(i, j – 1) + 1)
【代码】:
#include <bits/stdc++.h> using namespace std; const int AX = 1e3+66; int dp[AX][AX]; char a[AX]; char b[AX]; int main(){ while(~scanf("%s%s",a,b)){ memset(dp,0,sizeof(dp)); int n = strlen(a); int m = strlen(b); for( int i = 1 ; i <= n ; i++ ){ dp[i][0] = i; } for( int j = 1 ; j <= m ; j++ ){ dp[0][j] = j; } for( int i = 1 ; i <= n ; i++ ){ for( int j = 1 ; j <= m ;j++ ){ if( a[i-1] != b[j-1] ) dp[i][j] = min(dp[i-1][j-1],min(dp[i-1][j],dp[i][j-1])) + 1; else dp[i][j] = dp[i-1][j-1]; } } printf("%d\n",dp[n][m]); } return 0; }