会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
五分钟学大数据
侧边栏公告处有公众号【五分钟学大数据】二维码,可放心订阅,文章都会首发在公众号上。
博客园
首页
新随笔
联系
订阅
管理
2021年12月28日
Hive SQL优化思路
摘要: Hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。其中在开发过程中主要涉及到的可能是SQL优化这块。 优化的核心思想是: 减少数据量(例如分区、列剪裁) 避免数据倾斜(例如加参数、Key打散) 避免全表扫描(例如on添加加上分区等) 减少job数(例如相同的on条件的join放在一起
阅读全文
posted @ 2021-12-28 09:11 五分钟学大数据
阅读(3125)
评论(0)
推荐(0)
编辑
公告