摘要: 1. 问题描述在很多应用场景下,需要用到两个串之间的距离或相似度的概念(这两个概念是相互对偶的:定义了其中的一个,可以导出另一个的定义,参见[1])。例如关键字推荐 —— 用户输入一个串,推荐给用户所有”类似的“串。有很多种方法定义两个串之间的距离或相似度,例如 [2] 中第11章定义了很多串空间上的核函数,他们都可以用来度量两个串之间的相似度。编辑距离来源于近似字符串匹配问题。确定的字符串匹配问题寻求模式串 P 是否在文本串 T中出现,而近似字符串匹配允许出现少许误差。编辑距离的具体定义如下:串 P 和串 T之间的编辑距离定义为为了将 P 变为 T 所需的最少的操作数,所允许的操作为:Sub 阅读全文
posted @ 2013-06-04 09:58 半亩梨花 阅读(229) 评论(0) 推荐(0) 编辑