随笔分类 - 搜索
摘要:1、倒排索引 讲倒排索引之前先讲正牌索引,意思就是我们的所有文档都有唯一一个文档id,根据文档里的内容算出每个文档中关键字的内容和次数,类似于通过key去找value的形式,如果正牌索引,我们每次寻找关键字查询,就得搜索所有的文档去看是否有这个关键字,这样查询效率太慢了。于是有了倒排索引,是通过关键
阅读全文
摘要:题目:请简要介绍FIFO、LRU、LFU的含义和原理 含义: FIFO:First In First Out,先进先出LRU:Least Recently Used,最近最少使用 LFU:Least Frequently Used,最不经常使用 以上三者都是缓存过期策略。 原理和实现: 一、FIFO
阅读全文
摘要:局部敏感哈希(Locality-Sensitive Hashing, LSH)方法介绍 一、局部敏感哈希LSH 在很多应用领域中,我们面对和需要处理的数据往往是海量并且具有很高的维度,怎样快速地从海量的高维数据集合中找到与某个数据最相似(距离最近)的一个数据或多个数据成为了一个难点和问题。如果是低维
阅读全文