摘要: 一、hive文件存储格式 Hive支持的存储数的格式主要有:TEXTFILE 、SEQUENCEFILE、ORC、PARQUET。 上图左边为逻辑表,右边第一个为行式存储,第二个为列式存储。 行存储的特点: 查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需 阅读全文
posted @ 2019-10-03 13:13 newtest00 阅读(601) 评论(0) 推荐(0) 编辑
摘要: 一、分桶及抽样查询 1、分桶表创建 hive (db_test)> create table stu_buck(id int,name string) > clustered by(id) > into 4 buckets > row format delimited fields terminat 阅读全文
posted @ 2019-10-03 12:59 newtest00 阅读(1051) 评论(0) 推荐(0) 编辑