布隆过滤器(Bloom Filter)

使用

用来做大数据去重的。并且占用空间小。

原理

有一个全为0的byte数组 array。

把一个字符串a,使用hash算法,变成一个整数g,然后把array【g】位置的数变为1,代表这个数据出现过。

下次判断字符串a是否存在,就判断array【g】位置是否为1 。为1就存在,为0 就不存在。

优点

省空间

缺点

存在误判率。计算耗性能。

posted @ 2020-12-18 11:39  宁君  阅读(78)  评论(0编辑  收藏  举报