摘要: 来源:.Net.NewLife。 需求:假设在某系统存储了许多地址,例如:“北京市海淀区中关村大街1号海龙大厦”。用户输入“北京 海龙大厦”即可查询到这条结果。另外还需要有容错设计,例如输入“广西 京岛风景区”能够搜索到"广西壮族自治区京岛风景名胜区"。最终的需求是:可以根据用户输入,匹配若干条近似结果共用户选择。 目的:避免用户输入类似地址导致数据出现重复项。例如,已经存在“北京市中关村”,就不应该再允许存在“北京中关村”。 举例: 此类技术在搜索引擎中早已广泛使用,例如“查询预测”功能。 要实现此算法,首先需要明确“字符串近似”的概念。 计算字符串相似度通常使用的是动态 阅读全文
posted @ 2011-09-05 19:24 Aimeast 阅读(13442) 评论(29) 推荐(22) 编辑