会员
众包
新闻
博问
闪存
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Syn良子
每天都保持空杯心态
博客园
首页
新随笔
联系
订阅
管理
2017年3月21日
Spark性能优化之道——解决Spark数据倾斜(Data Skew)的N种姿势
摘要: 本文转发自Jason’s Blog,原文链接 http://www.jasongj.com/spark/skew/ 摘要 为何要处理数据倾斜(Data Skew) 什么是数据倾斜 数据倾斜是如何造成的 从数据源直接读取。如读取HDFS,Kafka 读取上一个Stage的Shuffle数据 如何缓解/
阅读全文
posted @ 2017-03-21 14:49 Syn良子
阅读(18021)
评论(2)
推荐(5)
编辑
公告