2011年6月3日

海量数据排序处理

摘要: 1. 给你A,B两个文件,各存放50亿条URL,每条URL占用64字节,内存限制是4G,让你找出A,B文件共同的URL。2. 有10个文件,每个文件1G, 每个文件的每一行都存放的是用户的query,每个文件的query都可能重复。要你按照query的频度排序 3. 有一个1G大小的一个文件,里面每一行是一个词,词的大小不超过16个字节,内存限制大小是1M。返回频数最高的100个词 4.海量日... 阅读全文

posted @ 2011-06-03 15:09 风乔 阅读(1560) 评论(0) 推荐(0) 编辑

导航