会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
请叫我海贼
博客园
首页
新随笔
联系
订阅
管理
2019年11月25日
Hive性能调优(二)----数据倾斜
摘要: Hive在分布式运行的时候最害怕的是数据倾斜,这是由于分布式系统的特性决定的,因为分布式系统之所以很快是由于作业平均分配给了不同的节点,不同节点同心协力,从而达到更快处理完作业的目的。 Hive中数据倾斜的原因: 数据在分布式节点上分部不均衡 join时某些key可能特别大(常见null值) gro
阅读全文
posted @ 2019-11-25 11:25 海贼王一样的男人
阅读(399)
评论(0)
推荐(0)
编辑
公告