会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
上海小墨子
博客园
首页
新随笔
联系
管理
订阅
2018年11月6日
hadoop的shuffle和排序
摘要: shuffle和排序 Shuffle阶段分为两部分:Map端和Reduce端。 一 map端shuffle过程; 1-内存预排序:默认每个map有100M内存进行预排序(为了效率),超过阈值,会把内容写到磁盘; 此过程使用快速排序算法; 2-根据key和reducer的数量进行分区和排序;首先根据数
阅读全文
posted @ 2018-11-06 22:12 上海小墨子
阅读(1032)
评论(0)
推荐(0)
编辑
公告