摘要:
1、只用2GB内存在20亿个整数中找到出现次数最多的数 初级进阶: 40亿个整数 高级进阶: 80亿个整数 思路 想要在很多整数中找到出现次数最多的数,通常的做法是使用哈希表对出现的每一个数做词频统计。 哈希表的key需要占用4B,value也是4B。 本题共有20亿个数,用32位的整数就可以表示其 阅读全文
摘要:
问题 认识布隆过滤器 布隆过滤器 (Bloom Filter)是由Burton Howard Bloom于1970年提出,它是一种space efficient的概率型数据结构,用于判断一个元素是否在集合中。在垃圾邮件过滤的黑白名单方法、爬虫(Crawler)的网址判重模块中等等经常被用到。哈希表也 阅读全文