会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
cqyyck
勤能补拙,好记性不如烂笔头!
博客园
首页
新随笔
联系
管理
订阅
2021年3月2日
Hive—分桶及抽样查询
摘要: 一、分桶 1.1介绍 分区针对的是数据的存储路径;分桶针对的是数据文件。 分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区,特别是之前所提到过的要确定合适的划分大小这个疑虑。 分桶是将数据集分解成更容易管理的若干部分的另一个技术。 2.原理 Hive中:按照分桶字段
阅读全文
posted @ 2021-03-02 08:33 cqyyck
阅读(652)
评论(0)
推荐(0)
编辑
公告