摘要: 1.简介 分桶表是对列值取哈希值的方式将不同数据放到不同文件中进行存储。对于hive中每一个表,分区都可以进一步进行分桶。由列的哈希值除以桶的个数来决定数据划分到哪个桶里。 2.适用场景 1.数据抽样【sampling】 2.map-join 3.开启支持分桶 配置;set hive.enforce 阅读全文
posted @ 2019-04-17 21:14 云山之巅 阅读(255) 评论(0) 推荐(0) 编辑