会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
云山之巅
------自学是你超越他人使自己变的重要的一种能力!
博客园
新随笔
联系
管理
2019年4月17日
Hive分桶
摘要: 1.简介 分桶表是对列值取哈希值的方式将不同数据放到不同文件中进行存储。对于hive中每一个表,分区都可以进一步进行分桶。由列的哈希值除以桶的个数来决定数据划分到哪个桶里。 2.适用场景 1.数据抽样【sampling】 2.map-join 3.开启支持分桶 配置;set hive.enforce
阅读全文
posted @ 2019-04-17 21:14 云山之巅
阅读(255)
评论(0)
推荐(0)
编辑
公告