会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
爱知菜的技术博客
博客园
首页
新随笔
联系
订阅
管理
2018年2月8日
Hadoop运行原理之Spill, Shuffle
摘要: Shuffle阶段又可以分为Map端的shuffle和Reduce端的Shuffle。 一、Map端的shuffle Map端会处理输入数据并产生中间结果,这个中间结果会写到本地磁盘(转者注: 这个中间结果可以压缩, 以节省IO),而不是HDFS。每个Map的输出会先写到内存缓冲区中,当写入的数据达
阅读全文
posted @ 2018-02-08 15:39 爱知菜
阅读(27)
评论(0)
推荐(0)
编辑
公告