布隆过滤器 (java)
布隆过滤器 (java)
概述
布隆过滤器概念:https://www.cnblogs.com/liyulong1982/p/6013002.html
布隆过滤器主要用于:
- 判断数据是否存在(有误判率,但不会出现假反例的情况,即不存在的数据一定会被过滤掉)
- 防止缓存穿透
google的工具包
做开发的当然没什么时间自己实现一套布隆过滤器,而且布隆过滤器还是会涉及数学知识,需要一些数学的功底,不是说想写就写的。但是google已经有一套布隆过滤器实现,所以我们拿来用十分方便。
guava里面有布隆过滤器的实现。
<!-- https://mvnrepository.com/artifact/com.google.guava/guava -->
<dependency>
<groupId>com.google.guava</groupId>
<artifactId>guava</artifactId>
<version>30.1.1-jre</version>
</dependency>
hutool工具包
国人开发的一套工具包,十分好用,里面也有布隆过滤器的实现
官网地址:Hutool — 🍬A set of tools that keep Java sweet.
<!-- https://mvnrepository.com/artifact/cn.hutool/hutool-all -->
<dependency>
<groupId>cn.hutool</groupId>
<artifactId>hutool-all</artifactId>
<version>5.7.5</version>
</dependency>
简易的实现
代码实现来自https://www.cnblogs.com/xiaobaituyun/p/11011393.html
当然网上还有很多博客也有写java代码实现的简易布隆过滤器,有一些还带有误判率参数的。如:https://blog.csdn.net/aaa_bbb_ccc_123_456/article/details/106055033
不过实际开发还是用Google那个guava。
import java.util.ArrayList;
import java.util.BitSet;
import java.util.List;
//这里帮原作者添加一些注释
public class BloomFilter {
//bitset的默认大小,(2 <<24)为2左移24为,既2*2^24位大小
private static final int DEFAULT_SIZE =2 <<24;
//种子(hash函数用到,使用质数是为了减低误判率)
private static final int[] seeds =new int[] {5,7,11,13,31,37,61 };
//比特集
private BitSet bits =new BitSet(DEFAULT_SIZE);
//自定义的简易的hash函数数组
private SimpleHash[] func =new SimpleHash[seeds.length];
public BloomFilter() {
for (int i =0; i < seeds.length; i++) {
func[i] =new SimpleHash(DEFAULT_SIZE, seeds[i]);
}
}
//添加一个数据到布隆过滤器(其实就算映射到bit集去)
public void add(String value) {
for (SimpleHash f : func) {
bits.set(f.hash(value),true);
}
}
//判断是否包含该数据
public boolean contains(String value) {
if (value ==null) {
return false;
}
boolean ret =true;
for (SimpleHash f : func) {
ret = ret && bits.get(f.hash(value));
}
return ret;
}
// 内部类,simpleHash,一个自定义的hash函数
public static class SimpleHash {
private int cap;
private int seed;
public SimpleHash(int cap,int seed) {
this.cap = cap;
this.seed = seed;
}
//获取hash值(主要通过字符串的每个字符ASCII码值来计算)
public int hash(String value) {
int result =0;
int len = value.length();
for (int i =0; i < len; i++) {
result = seed * result + value.charAt(i);
}
return (cap -1) & result;
}
}
}
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)