LSH学习
LSH搞的不是很明白,看了很多资料,走了不少弯路,现将有用的资料整理如下:
-
IR12 Locality Sensitive Hashing
这个Youtube讲座深入浅出,从0开始讲解LSH,基本将LSH的方方面面覆盖到了,特别是为什么要有多个哈希函数,多个哈希表,L和K的权衡解释的很好。最后介绍了LSH的另一种计算方法,simhash,但是没有详细说明它和超平面法的联系。
-
彻底弄懂LSH之simHash算法[通俗易懂] - 腾讯云开发者社区-腾讯云
这篇文章详细介绍了simHash的算法,并解释了它和超平面法的联系。随机选取平面某种程度上相当于随机选取向量(法向量)。
-
这是我最开始看的文章之一,但是看的云里雾里,什么多表多函数,现在反过来看它更像是一份总结。同时这里还提到了一个技术Multiprobe,是上面两份资料所缺失的。
-
局部敏感哈希深度解析(locality-sensetive hashing, LSH)(一)_lsh深度哈希_盛爷的博客-CSDN博客
这篇文章基于两篇论文给出了LSH的详细的解释,有不少公式和图片,属于是对上面内容的补充。
-
https://towardsdatascience.com/similarity-search-part-5-locality-sensitive-hashing-lsh-76ae4b388203