摘要: 一、简介Bloom filter介绍Bloom Filter(BF)是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。它是一个判断元素是否存在集合的快速的概率算法。Bloom Filter有可能会出现错误判断,但不会漏掉判断。因此,Bloom Fi... 阅读全文
posted @ 2015-04-14 16:03 为了生活,加油 阅读(2676) 评论(0) 推荐(0) 编辑
摘要: 前提我们在进行日志分析的时候,那么日志的数据是杂乱无章的,或则说日志的数据并不是我们都想看到的。所以我们需要对里面的数据进行清洗,说的直白一点就是要过滤里面的字符串。下面便是我们需要去过滤的原始数据:183.131.11.98 - - [01/Aug/2014:01:01:05 +0800] "GE... 阅读全文
posted @ 2015-04-14 10:05 为了生活,加油 阅读(1102) 评论(0) 推荐(0) 编辑