摘要: 布隆过滤器的原理就不介绍了,到网上搜搜会找到的。这里说一下最佳的选取参数。P是需要的误差率,n是读取的数据条数。系统首先要计算需要的内存大小m bits:再由m,n得到hash function的个数:如果误差率在万分之一,n是一亿条,则需要19亿比特内存,13个hash函数。下面是我参考别人的布隆过滤器,修改的。。进攻参考。。public class BloomFilter { // BitArray 初始分配2^29个bit private static int DEFAULT_SIZE = 1 << 30; //不同哈希函数的种子,一般应取质数 private static 阅读全文
posted @ 2012-09-13 15:57 doo 阅读(243) 评论(0) 推荐(0) 编辑