会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
十七楼的羊
博客园
首页
新随笔
联系
订阅
管理
2019年3月17日
spark shuffle 过程分析
摘要: spark shuffle 过程分析:一普通机制: 1,首先 reduceBykey 是会将每一个 key 对应的所有value聚合成一个value,然后生成一个rdd,元素类型是形式,然后每一个k对应一个聚合起来的v 2,每一个k对应的v 不一定在一个节点之上,也不可能是在一个 partition中 3,聚合过程: 1),Shuffle Write 上一个map ...
阅读全文
posted @ 2019-03-17 11:31 十七楼的羊
阅读(248)
评论(0)
推荐(0)
编辑
公告