2018年11月25日
摘要: 问题描述:有一个1GB大小的文件,文件里面每一行是一个词,每个词的大小不超过16B,内存大小限制为1MB,要求返回频数最高的100个词。分析:由于文件大小为1GB,而内存的大小只有1MB,因此不能一次把所有的词读入到内存中去处理,可以采用分治的方法进行处理:把一个文件... 阅读全文
posted @ 2018-11-25 21:00 CircleYuan 阅读(604) 评论(0) 推荐(0) 编辑
摘要: 题目描述:给定a、b两个文件,各存放50亿个url,每个url各占64B,内存限制是4GB,请找出a、b两个文件共同的url分析:由于每个url需要占64B,所以50亿个url占用空间大小为50亿×64=5GB×64=320GB.由于内存大小只有4GB,因此不可能一次... 阅读全文
posted @ 2018-11-25 20:31 CircleYuan 阅读(509) 评论(0) 推荐(0) 编辑