摘要: Hive 分区表、分桶表和分桶抽样 一、使用场景 ​ 分区表和分桶表都是为大规模数据集查询优化而设计出来了,通过在物理存储文件上的划分,防止查询时的全表扫描提高查询效率。实际生产中分区表使用较多,分桶表由于在建表时固定了桶的个数,不适合于持续不断膨胀的表,故使用较少,但仍有分区、分桶同时使用的。 二 阅读全文
posted @ 2021-04-21 21:24 davonchen 阅读(668) 评论(0) 推荐(0) 编辑