会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
QZhen
博客园
首页
新随笔
联系
订阅
管理
2020年5月23日
表优化
摘要: 1.小表、大表join 将key相对分散,并且小表放在join左边,减少内存溢出的几率,也可以用mapjoin让小表先进内存,在map端完成reduce。 新版hive已经对这做了优化,大小表在join左边或者右边差不多 2.大表join大表 空key过滤 join操作在相同key数据太多时会将数据
阅读全文
posted @ 2020-05-23 21:01 Q1Zhen
阅读(150)
评论(0)
推荐(0)
编辑
公告