C - 编辑距离

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。例如将kitten一字转成sitting:

sitten (k->s)

sittin (e->i)

sitting (->g)

所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。

给出两个字符串a,b,求a和b的编辑距离。

Input

    第1行:字符串a(a的长度 <= 1000)。

    第2行:字符串b(b的长度 <= 1000)。

Output

   输出a和b的编辑距离

Sample Input

  kitten

  sitting

Sample Output

  3


思路转载:http://www.cnblogs.com/biyeymyhjob/archive/2012/09/28/2707343.html

思路主要就是对齐。我代码解析了。细节在上面的网站。

代码如下:

#include<iostream>
#include<cstdio>
#include<cstring>

using namespace std;

int str[1005][1005];
char a[1004];
char b[1004];
int  lena,lenb;

void cmp()
{
    ///初始化。
    ///代表着竖着的变成横着的添加数目、
    for(int i=0;i<=lena;i++)
    {
        str[i][0] = i;
    }
     ///代表着竖着的变成横着的字符串的减少数目。
    for(int j=0;j<=lenb;j++)
    {
        str[0][j] = j;
    }
    ///开始对齐,求下面变成上面的字符串的最小的变化次数
    ///从1开始,0的都已经赋值,
    for(int i=1;i<=lena;i++)
    {
        for(int j=1;j<=lenb;j++)
        {
            int d1;
            ///表示之前的自身改变一个字符,或者前面的字符串添加一个字符,取最小的
            int d2  = min(str[i-1][j]+1,str[i][j-1]+1);
            if(a[i-1]==b[j-1])
            {
                ///不需要改变
                d1=0;
            }else{
               ///需要一次改变,使得a[i] = b[j]
               d1=1;
            }
            ///左上方的未改变的加上d1(添加一个字符或者不变),变成现在的字符串,与d2比较,去最小。
            str[i][j] = min(d2,d1+str[i-1][j-1]);
        }
    }
}

int main()
{
    while(cin>>a>>b)
    {
        lena = strlen(a);
        lenb = strlen(b);
        cmp();
        printf("%d\n",str[lena][lenb]);
    }
    return 0;
}

posted @ 2017-07-31 10:26  让你一生残梦  阅读(173)  评论(0编辑  收藏  举报