Fork me on GitHub
摘要: SimHash原理 1.SimHash背景 SimHash算法来自于 GoogleMoses Charikar发表的一篇论文“detecting near duplicates for web crawling” ,其主要思想是降维, 将高维的特征向量映射成低维的特征向量,通过两个向量的Hammin 阅读全文
posted @ 2019-12-14 13:41 是阿凯啊 阅读(3006) 评论(0) 推荐(0) 编辑