2020 年 4月 5 日随笔档案 - 挪威森林猫Zzz

2020年4月5日

摘要： 1.先过滤,再查询,因为每次生成中间表都会存储到Linux磁盘上 , 记住 , 不是HDFS 2.注意数据倾斜 , 倾斜的原因是reduce端数据的大量富集, 可适度增加reduce , 会着开启 Reduce自己判断 , 某一比较大 , 自己再分开点.也就是合理设置 reduce数量 hive.e 阅读全文

posted @ 2020-04-05 08:50 挪威森林猫Zzz 阅读(321) 评论(0) 推荐(0) 编辑

挪威森林猫

花有重开日人无再少年

公告

挪威森林猫

花有重开日 人无再少年

公告

花有重开日人无再少年