数据倾斜

1、原因

业务数据本身的特性

key分布不均匀

建表时考虑不周

某些SQL语句本身就有数据倾斜

 

2、设计思路

假如只有一个key数据倾斜,首先对表A进行采样,统计出最倾斜的key。将A表分为A1只有倾斜key,A2不包含倾斜key,然后分别与B链接。

posted @ 2018-02-07 10:42  海东青Lo  阅读(119)  评论(0编辑  收藏  举报