Hive的分桶表
摘要:【分桶概述】 Hive表分区的实质是分目录(将超大表的数据按指定标准细分到指定目录),且分区的字段不属于Hive表中存在的字段;分桶的实质是分文件(将超大文件的数据按指定标准细分到分桶文件),且分桶的字段必须在Hive表中存在。 分桶的意义在于: 可以提高多表join的效率(因为通过分桶已经将超大数
阅读全文
posted @ 2021-09-12 22:40
posted @ 2021-09-12 22:40