摘要: 分桶表数据存储 分区针对的是数据的存储路径;分桶针对的是数据文件。 分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区,特别是之前所提到过的要确定合适的划分大小这个疑虑。 分桶是将数据集分解成更容易管理的若干部分的另一个技术。 创建分桶表 create table s 阅读全文
posted @ 2021-01-10 19:54 Leo-Wong 阅读(578) 评论(0) 推荐(0) 编辑
摘要: ####数据导入到hive(Load) 语法: hive> load data [local] inpath '/filePath/filename.txt' [overwrite] into table tableName [partition (partcol1=val1,…)]; 释义: lo 阅读全文
posted @ 2021-01-10 16:44 Leo-Wong 阅读(169) 评论(0) 推荐(0) 编辑
摘要: ####建表语句: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY 阅读全文
posted @ 2021-01-10 13:02 Leo-Wong 阅读(1257) 评论(0) 推荐(0) 编辑
摘要: ###数据类型:基本数据类型、集合数据类型 ####基本数据类型 ####集合数据类型 ####建表语句: create table test( name string, friends array<string>, children map<string, int>, address struct 阅读全文
posted @ 2021-01-10 12:03 Leo-Wong 阅读(752) 评论(0) 推荐(0) 编辑
摘要: ####在hive命令行、或者开启hiveserver2使用beeline连接hive去查询特别的繁琐,操作也没有那么方便,下面给大家推荐一个程序员爱不释手的高效的开发工具:DBeaver,他来了! #####可以看到可以用这个客户端连接:mysql、Oracle、hive等。 下载地址: 链接:h 阅读全文
posted @ 2021-01-10 00:09 Leo-Wong 阅读(1675) 评论(1) 推荐(0) 编辑