摘要: 场景题 有 100 机器,每个机器的磁盘特别大,磁盘大小为 1T,但是内存大小只有 4G,现在每台机器上都产生了很多 ip 日志文件,每个文件假设有50G,那么如果计算出这 100 太机器上访问量最多的 100 ip 呢?也就是Top 100。 思路 其实,一开始我有往布隆过滤器那边考虑,但是布隆过 阅读全文
posted @ 2021-10-09 00:05 第十六封 阅读(865) 评论(2) 推荐(4) 编辑