第三章上机实践报告
一、实践题目
7-3 编辑距离问题 (30 分)
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括 (1)删除一个字符; (2)插入一个字符; (3)将一个字符改为另一个字符。 将字符串A变换为字符串B所用的最少字符操作数称为字符串A到 B的编辑距离,记为d(A,B)。 对于给定的字符串A和字符串B,计算其编辑距离 d(A,B)。
输入格式:
第一行是字符串A,文件的第二行是字符串B。
提示:字符串长度不超过2000个字符。
输出格式:
输出编辑距离d(A,B)
二、问题描述
给定字符串A=“fxpimu”和B=“xwrs”,计算A经过增删替变成B的最小字符操作次数。
三、算法描述
d[i][j] 为 A到B的编辑距离
d[1][0]为 f到“ ”的编辑距离
d[0][1]为 “ ”到x的编辑距离
初始化:
|
0 |
f |
x |
p |
i |
m |
u |
0 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
x |
1 |
|
|
|
|
|
|
w |
2 |
|
|
|
|
|
|
r |
3 |
|
|
|
|
|
|
s |
4 |
|
|
|
|
|
|
填表:
|
0 |
f |
x |
p |
i |
m |
u |
0 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
x |
1 |
1(1) |
1(2) |
2 |
3 |
4 |
5 |
w |
2 |
2 |
2 |
2 |
3 |
4 |
5 |
r |
3 |
3 |
3 |
3 |
3 |
4 |
5 |
s |
4 |
4 |
4 |
4 |
4 |
4 |
5 |
(1)填1原因:f到x,只需替换一项。
(2)填1原因:“fx”到“x”, x=x,因此只需删除一项。
递推公式:
d[i][j]=0 i=j=0
d[i][j]=i j=0
d[i][j]=j i=0
d[i][j]=min(d[i][j-1]+1,d[i-1][j-1]+1,d[i-1][j-1]+f(i,j)) f(i,j)为第i个字符和第j个字符是否相等,相等f(i,j)=0;不相等f(i,j)==1
四、时间复杂度分析
时间复杂度:O(n*m),填表的时间。
空间复杂度:O(n*m),d的大小。
五、代码
#include<iostream> using namespace std; int main(){ string a,b; cin>>a; cin>>b; int x=a.length(),y=b.length(); int d[x+1][y+1]; for (int i=1;i<=x;i++){ d[i][0]=i; } for (int j=1;j<=y;j++){ d[0][j]=j; } for (int i=1;i<=x;i++){ for (int j=1;j<=y;j++){ if (a[i-1]==b[j-1]){ d[i-1][j-1]=d[i-1][j-1]; } else { d[i-1][j-1] = d[i-1][j-1]+1; } d[i][j]=min(d[i][j-1]+1,min(d[i-1][j]+1,d[i-1][j-1])); } } cout<<d[x][y]; return 0; }
六、感想
动态规划真的太强大了,如果不查资料让我自己去想的话我真的想不出来。在明白了原理之后,自己写代码的时候我还是遇到了问题,我将i和j的位置搞混了,所以结果就错了。好像是i和j的位置决定了A字符串变B字符串还是B字符串变A字符串。所以啊,还是要脚踏实地地学习,只有从错误中学习,才会慢慢地进步。