摘要: 1.left join产生的数据倾斜 两个子集LEFT JOIN之后GROUP BY从代码角度出发更综合,但是当两个子集特别大时,会影响到效率,应该分别GROUP BY之后再进行LEFT JOIN,防止数据倾斜; 2.维度理解 维度太多了,有个dwd层放入多个维度,比如一个用户在不同的页面操作一个内 阅读全文
posted @ 2021-03-29 16:27 齐方 阅读(127) 评论(0) 推荐(0) 编辑