06 2016 档案

Hive数据仓库笔记(二)
摘要:分区和桶: 分区:可以提高查询的效率,只扫描固定范围数据,不用全部扫描 CREATE TABLE logs (ts BIGINT, lineSTRING) PARTITIONED BY (dt STRING, country STRING); 通过关键字PARTITIONED BY 定义分区表 LO 阅读全文

posted @ 2016-06-28 17:52 chaplinthink 阅读(157) 评论(0) 推荐(0)

Hive数据仓库笔记(一)
摘要:Hive建表: CREATE TABLE records (year STRING,temperature INT, quality INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; 每行三列数据通过tab分隔,数据如果是以tab分隔的可被hi 阅读全文

posted @ 2016-06-27 18:03 chaplinthink 阅读(308) 评论(0) 推荐(0)

导航