摘要: 1、100亿个数字找出最大的10个 1、首先一点,对于海量数据处理,思路基本上是确定的,必须分块处理,然后再合并起来。 2、对于每一块必须找出10个最大的数,因为第一块中10个最大数中的最小的,可能比第二块中10最大数中的最大的还要大。 3、分块处理,再合并。也就是Google MapReduce 阅读全文
posted @ 2017-02-09 09:18 Genesisx 阅读(903) 评论(0) 推荐(0) 编辑