醉月风纯
一个即将参加校招的学渣

导航

 

2018年8月1日

摘要:     布隆过滤器(Bloom Filter)是一种节省空间的概率数据结构,由Burton Howard Bloom在1970年提出,用来测试一个元素是否在一个集合里。有可能”误报“,但肯定不会”错报“:对布隆过滤器的一次查询要么返回“可能在集合中“,要么”肯 阅读全文
posted @ 2018-08-01 21:58 醉月风纯 阅读(157) 评论(0) 推荐(0) 编辑
 
摘要: Q1: 给出n个数,n 阅读全文
posted @ 2018-08-01 21:38 醉月风纯 阅读(80) 评论(0) 推荐(0) 编辑
 
摘要: 处理海量数据问题的方法大概有以下几种:   1 Bloom filter   2 BitMap   3 字典树   4 外排   5 分布式处理之Hadoop 本文接下来对这5种方法模式结合对应的海量 阅读全文
posted @ 2018-08-01 16:15 醉月风纯 阅读(224) 评论(0) 推荐(0) 编辑
 
摘要:     Tire树,即字典树,又称单词查找树或键树,是一种树型结构,是一种哈希树的变种。典型的应用是统计和排序大量的字符串(不仅限于字符串),所以经常被搜索引擎用于文本词频统计。它的优点是:最大限度地减少无畏的比较,查询效率比哈希表高。    阅读全文
posted @ 2018-08-01 12:02 醉月风纯 阅读(140) 评论(0) 推荐(0) 编辑