1
摘要: HIVE 优化: 场景1. 分组聚合group by 导致数据倾斜 -- map端聚合 : aggr=true 会在mapper端先group by一次,最后再把结果merge起来,为了减少reducer处理的数据量 指令: Set hive.groupby.mapaggr.checkinterva 阅读全文
posted @ 2024-07-10 12:28 萌哥-爱学习 阅读(2) 评论(0) 推荐(0) 编辑