会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
俊学之道
博客园
首页
新随笔
联系
管理
订阅
2018年12月22日
大数据优化之数据倾斜
摘要: 数据倾斜 数据倾斜概念 在做计算的时候,数据的分散度不够(数据的Key分布不均),导致数据分布在一台或几台机器计算 症状:典型的现象就是数据reduce到99%很久不动了 数据倾斜原因 总原因:key分布不均 业务数据的特点(数据的幂律分布) 人为建表的疏忽 join、group by、count
阅读全文
posted @ 2018-12-22 22:23 俊学之道
阅读(1100)
评论(0)
推荐(0)
编辑
公告