随笔- 59
文章- 0
评论- 17
阅读-
18万
随笔分类 - basic knowledge
近似最近邻搜索 (三) 局部敏感哈希 LSH
摘要:LSH 目录LSH locality sensitive hashing(LSH) 是哈希算法中,比较重要的方法。LSH方法是将相似的数据以较高的概率哈希到同一个桶里面,从而达到近似邻检索的目的,另外,待测数据维度非常大时,lsh也可用于降维。 LSH族[1] LSH族 \(\mathcal H =
阅读全文
近似最近邻搜索 (二) 树方法
摘要:树方法 kd-tree kd-tree (k dimensional tree )是树方法的经典算法,其是二分搜索树在多维空间的推广。二分搜索树检索迅速的原因是规定将数据中大于当前节点数据的方在一侧(比如右子树),而不小于的放在另一侧(比如左子树),这样检索数据时,即可获得logn的速度。kd-tr
阅读全文
近似最近邻搜索 (四) HNSW: Hierarchical Navigable Small World graphs
摘要:HNSW: Hierarchical Navigable Small World graphs 近邻图技术, 目前绝大部分的近邻图检索技术采用贪婪检索形式。给定一个近邻图,从其中某一点(进入点的选择可以是随机也可以是根据某种逻辑)进入,然后迭代地计算当前点与query的距离,直到满足终止条件。使用近
阅读全文
近似最近邻搜索 (一) Approximate Nearest Neighbor Search(ANNS)
摘要:Approximate Nearest Neighbor Search(ANNS) 目录Approximate Nearest Neighbor Search(ANNS)树方法kd-tree 在一个给定的空间(或集合)中找到距离兴趣(或目标)对象最近的邻居,这个问题在多种领域都是非常基本而重要的,
阅读全文
噪声对比估计 Noise-contrastive estimation
摘要:Noise-contrastive estimation 噪声对比估计 目录 Noise-contrastive estimation 噪声对比估计 这份简短的NCE博文是对自然语言处(四) 词向量编码 word2vec 的一个小补充或额外资料吧. 在统计中, 估计非标准化的模型参数是非常困难的,或
阅读全文
机器学习七 参数估计方法
摘要:参数估计方法 推断问题中, 一般会碰到两个问题: 1.参数估计问题: 已知 观测数据集 X, 估计其分布参数 , 也就是 2. 预测或回归问题: 已知观测数据集 X, 推测新观测数据 , 也就是 计算
阅读全文