会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
宁君
博客园
首页
新随笔
联系
订阅
管理
2020年12月15日
最详细10招Spark数据倾斜调优
摘要: 最详细10招Spark数据倾斜调优 数据量大并不可怕,可怕的是数据倾斜 。 数据倾斜发生的现象 绝大多数 task 执行得都非常快,但个别 task 执行极慢。 数据倾斜发生的原理 在进行 shuffle 的时候,必须将各个节点上相同的 key 的数据拉取到某个节点 上的一个 task 来进行处理,
阅读全文
posted @ 2020-12-15 23:28 宁君
阅读(541)
评论(0)
推荐(0)
编辑
公告