bloom布隆过滤器
1.bloom简介
2.bloom的设计思想
bloom实现的总体思想是使用bitset,存储数据的hash值,一般一个数据会使用多个hash函数生成值
这样查看目标数据是否存在的时候,只要看相应的hash值对应的位置是否都为1,即可判断是否不存在。
这里要注意的是:
bloom返回true,不代表一定存在,因为有一定的误差范围
bloom返回false,则说明数据一定不存在,因为同样的数据产生的hash值总是相同,所以只要加入bitset,则下次查询相应位一定为1.
bloom能精确判断数据不存在,模糊判断数据存在(精度度可控制),不能反查出原生数据
下图是bloom命中,而且实际也存在这个值的情况
下图是bloom命中,但是实际不存在这个值的情况
下面是bloom没命中,实际不存在这个值的情况(bloom没命中,则肯定不会存在这个值)
下面是查询时bloom过滤器的工作逻辑
参考文档:
https://www.jasondavies.com/bloomfilter/
https://hackernoon.com/probabilistic-data-structures-bloom-filter-5374112a7832