会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
天马流欣
博客园
首页
新随笔
联系
订阅
管理
2020年9月9日
Spark的Shuffle和MR的Shuffle异同
摘要: 介绍 不论MapReduce还是RDD,shuffle都是非常重要的一环,也是影响整个程序执行效率的主要环节,但是在这两个编程模型里面shuffle却有很大的异同。 shuffle的目的是对数据进行混洗,将各个节点的同一类数据汇集到某一个节点进行计算,为了就是分布式计算的可扩展性。 可能大家多MR的
阅读全文
posted @ 2020-09-09 13:41 天马流欣
阅读(1390)
评论(1)
推荐(0)
编辑
公告