摘要: 数据倾斜 数据倾斜概念 在做计算的时候,数据的分散度不够(数据的Key分布不均),导致数据分布在一台或几台机器计算 症状:典型的现象就是数据reduce到99%很久不动了 数据倾斜原因 总原因:key分布不均 业务数据的特点(数据的幂律分布) 人为建表的疏忽 join、group by、count 阅读全文
posted @ 2018-12-22 22:23 俊学之道 阅读(1100) 评论(0) 推荐(0) 编辑