Alex He

...永远保持希望与激情...约会未来更强大的自己...

 

2010年12月31日

[算法集锦]编辑距离分析与实现

摘要: 编辑距离的分析与实现 做文本分析的时候,我们常常需要计算两篇文本的相关性(相关性除了可以使用相似度还可以使用距离-当然是应该反着来算的),如果你不知道把文本转换为一个向量(如果你知道这个,那遭了,因为那样你就可能认为我这里的很rubbish了),那你可能会考虑我们这里介绍的最朴素的方法-计算字符串间编辑距离的方法。 先给出我遇到的问题(也即定义编辑距离):设A 和B 是两个字符串。对于字符串可以执行如下操作:(1) 删除一个字符;(2)插入一个字符;(3)将一个字符替换成另外一个字符。例如将kitten一字转成sitting:(1). sitten (k→s)(2). sittin (e→i) 阅读全文

posted @ 2010-12-31 17:28 Alex木头 阅读(1685) 评论(0) 推荐(1) 编辑

导航