会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
复制代码
pg633
人生的不同取决于你的选择,只要还有选择的权力,你的人生必定不同
博客园
新随笔
联系
管理
2019年9月14日
spark 调优指南
摘要: 一 流程详解 spark 最重要的就是shuffle 过程,就是所谓的mr 过程中进行处理map reduce 中的过程 减少shuffle 过程其实就是两个思路。 尽量不改变key,使其在local 完成,减少网络IO 磁盘IO和cpu 开销 减少shuffle 数据规模 ''' 1. 去重后un
阅读全文
posted @ 2019-09-14 16:21 pg633
阅读(141)
评论(0)
推荐(1)
编辑