会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
xiaopengfei
博客园
首页
新随笔
联系
订阅
管理
2019年8月6日
hive分桶表bucketed table分桶字段选择与个数确定
摘要: 为什么分桶 (1)获得更高的查询处理效率。桶为表加上了额外的结构,Hive 在处理有些查询时能利用这个结构。具体而言,连接两个在(包含连接列的)相同列上划分了桶的表,可以使用 Map 端连接 (Map-side join)高效的实现。比如JOIN操作。对于JOIN操作两个表有一个相同的列,如果对这两
阅读全文
posted @ 2019-08-06 22:14 xiaopengfei
阅读(5363)
评论(0)
推荐(0)
编辑
公告