摘要: 比较不同的文章、图片啊什么的是否相似,如果一对一的比较,数据量大的话,以O(n2)的时间复杂度来看,计算量相当惊人。所以如果是找相同就好了,直接扔到一个hashmap中即可。这样就是O(n)的复杂度了。不过相同的字符串一定会得到相同的hash,而不同的字符串,哪怕只有一点点不同,也极可能得到完全不同hash。很自然的想到,要是相似的object能够得到相似的hash就好了。局部敏感哈希就是这样的h... 阅读全文
posted @ 2015-10-11 18:19 一路绝尘 阅读(1480) 评论(0) 推荐(0) 编辑