摘要:
文本或模式串中的拼写错误让我们不得不找出“相似”而非相等的匹配;基因序列或语言文字的演化让我们常常用古老的模式在脑海里搜索:“尔等休要取人性命”变成了“你们别杀人”。如果我们要处理非精确匹配,首先就应该定义一个代价函数,衡量两个字符串“差得有多远”,即两个字符串之间的距离度量。一个合理的距离度量是把一个字符串变到另一个字符串所需的最小修改次数。有3种常见的修改方式:·替换-把模式串s中的一个字符替换成文本串t中的一个不同字符,例如把“shot”变成“spot”。·插入-在模式串s中插入一个新字符,使得它和t更接近。例如把”ago“变成”agog“。·删除-在模式串 阅读全文