摘要: 一、分桶 1.1介绍 分区针对的是数据的存储路径;分桶针对的是数据文件。 分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区,特别是之前所提到过的要确定合适的划分大小这个疑虑。 分桶是将数据集分解成更容易管理的若干部分的另一个技术。 2.原理 Hive中:按照分桶字段 阅读全文
posted @ 2021-03-02 08:33 cqyyck 阅读(621) 评论(0) 推荐(0) 编辑