Fork me on GitHub
摘要: 一.基本概念 Hive分桶: 1.概念 分桶表是对列值取哈希值的方式,将不同数据放到不同文件中存储。对于hive中每一个表、分区都可以进一步进行分桶。(可以对列,也可以对表进行分桶)由列的哈希值除以桶的个数来决定每条数据划分在哪个桶中。 2.设置 set hive.enforce.bucketing 阅读全文
posted @ 2018-01-14 21:53 L先生AI课堂 阅读(363) 评论(0) 推荐(0) 编辑