摘要: 在看《编程珠玑》变位词程序的时候看到签名算法的思想非常好...Soundex是一种语音算法,利用英文字的读音计算近似值,值由四个字符构成,第一个字符为英文字母,后三个为数字。在拼音文字中有时会有会念但不能拼出正确字的情形,可用Soundex做类似模糊匹配的效果。之前做过模糊匹配,用的是正则表达式。但显然,用签名算法的效率更高。算法简要说明将英文字按以下规则替换(除第一个字符外): a e h i o u w y -> 0 b f p v -> 1 c g j k q s x z -> 2 d t -> 3 l -> 4 m n -> 5 r -> 6去 阅读全文
posted @ 2012-12-14 08:29 ifeixiang 阅读(2291) 评论(0) 推荐(0) 编辑