最短编辑距离
题目链接:https://www.acwing.com/problem/content/description/904/
题目描述
给定两个字符串 A 和 B,现在要将 A 经过若干操作变为 B,可进行的操作有:
删除–将字符串 A 中的某个字符删除。
插入–在字符串 A 的某个位置插入某个字符。
替换–将字符串 A 中的某个字符替换为另一个字符。
现在请你求出,将 A 变为 B 至少需要进行多少次操作。
输入描述
第一行包含整数 n,表示字符串 A 的长度。
第二行包含一个长度为 n 的字符串 A。
第三行包含整数 m,表示字符串 B 的长度。
第四行包含一个长度为 m 的字符串 B。
字符串中均只包含大写字母。
输出描述
输出一个整数,表示最少操作次数。
1≤n,m≤1000
示例
输入
10
AGTCTGACGC
11
AGTAAGTAGGC
输出
4
分析
约定
第一个字符串表示为a,长度为n
第二个字符串表示为b,长度为m
状态表示
f(i,j)表示a的前i个字符变为b的前j个字符所需要的最少操作次数
状态划分与计算
关于本题的状态划分和计算,我没有找到非常严谨的分析过程,只能综合各种回答,给出我认为最好的分析。
可证明:一定存在一种操作顺序,使得我们可以从左到右进行操作就可以得到最优解,所以这里可以假定最后一步只会操作a[i]和b[j]。
该证明我没有找到怎么证的,但结论应该是正确的。不摆出这个证明的话分析就更不严谨了。
由上面的证明我们可以通过最后一步对a的操作进行状态划分。(a和b等价分析谁都一样)
划分与计算如下:
- 插入操作:此时要添加,只能添加b[j]了,说明a的前i个字符已经变成b的前j-1个字符了,此时f(i,j)=f(i,j-1)+1
- 删除操作:此时要删除a[i],说明a的前i-1个字符已经变成了b的前j个字符,此时f(i,j)=f(i-1,j)+1
- 替换操作: 此时先判断a[i]是否等于b[j],如果不等,则应将a[i]替换为b[j],说明a的前i-1个字已经变成了b的前j-1个字符,此时f(i,j)=f(i-1,j-1)+1。如果a[i]=b[j],则无需操作,此时f(i,j)=f(i-1,j-1)
状态转移方程
再来考虑一下边界条件:
- f(0,0),代表两个字符串均空,等于0
- f(i,0),代表a由i个字符要变成空串,显然要做i次删除,等于i
- f(0,j),代表a这个空串要变成有j个字符的b串,显然要做j次插入,等于j
由上一步的分析和对边界的考虑,我们得到状态转移方程如下:
AC代码
#include <iostream>
#include <algorithm>
using namespace std;
const int N = 1001;
int n, m;
char a[N], b[N];
int f[N][N];
int main()
{
cin >> n >> a;
cin >> m >> b;
for (int i = 0; i <= n; i++) //边界处理
f[i][0] = i;
for (int j = 0; j <= m; j++)
f[0][j] = j;
for (int i = 1; i <= n; i++)
{
for (int j = 1; j <= m; j++)
{
f[i][j] = min(f[i][j - 1] + 1, f[i - 1][j] + 1);
if (a[i - 1] == b[j - 1])
f[i][j] = min(f[i][j], f[i - 1][j - 1]);
else
f[i][j] = min(f[i][j], f[i - 1][j - 1] + 1);
}
}
cout << f[n][m] << endl;
return 0;
}