会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Genesis
博客园
首页
新随笔
联系
订阅
管理
2017年2月9日
大数据量处理
摘要: 1、100亿个数字找出最大的10个 1、首先一点,对于海量数据处理,思路基本上是确定的,必须分块处理,然后再合并起来。 2、对于每一块必须找出10个最大的数,因为第一块中10个最大数中的最小的,可能比第二块中10最大数中的最大的还要大。 3、分块处理,再合并。也就是Google MapReduce
阅读全文
posted @ 2017-02-09 09:18 Genesisx
阅读(903)
评论(0)
推荐(0)
编辑
公告