摘要: 1.先过滤,再查询,因为每次生成中间表都会存储到Linux磁盘上 , 记住 , 不是HDFS 2.注意数据倾斜 , 倾斜的原因是reduce端数据的大量富集, 可适度增加reduce , 会着开启 Reduce自己判断 , 某一比较大 , 自己再分开点.也就是合理设置 reduce数量 hive.e 阅读全文
posted @ 2020-04-05 08:50 挪威森林猫Zzz 阅读(321) 评论(0) 推荐(0) 编辑