摘要: 布隆过滤器常常被用来检测某个元素是否是巨量数据集合中的成员 1、基本原理: (1)将长度为m的位数组元素全部置为0; (2)对集合S中的某个成员a,分别用k个哈希函数对其计算,如果hi(a)=x(1<=i<=k, 1<=x<=m),则将位数组的第x位置为1,对于成员a来说,可能会将位数组中w(w<= 阅读全文
posted @ 2018-04-22 20:55 游鸿 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 1、介绍 gfs是构建在廉价服务器之上的大型分布式文件系统。 设计原则: gfs组件失效是常态事件,而不是意外事件。gfs构建在普通商业PC之上,这些PC的稳定性并没有很高的保障,任何时间都可能发生组件无法工作。 gfs文件系统中存储的文件大部分是数GB的大文件。 绝大部分文件的修改是在文件末尾追加 阅读全文
posted @ 2018-04-22 15:30 游鸿 阅读(2868) 评论(0) 推荐(0) 编辑