hive 常用命令

1、创建表

内部表

CREATE TABLE table_a (col_1 int, col_2 int, col_3 int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

外部表

CREATE EXTERNAL TABLE table_a (col_1 int, col_2 int, col_3 int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

分区表

CREATE TABLE table_a (col_1 int, col_2 int, col_3 int) PARTITIONED BY (`type` string COMMENT '分区') ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

2、修改表

表重命名

ALTER TABLE table_a RENAME TO table_b;

增加一个字段

ALTER TABLE table_a ADD COLUMNS (col_4 String);

修改字段

alter table table_a change col_4 col_5 string COMMENT '说明'; --改列名
alter table table_a change col_4 col_4 string COMMENT '说明BB'; -- 改说明
alter table table_a change col_4 col_4 int COMMENT '说明'; -- 改类型

删除字段

ALTER TABLE table_a REPLACE COLUMNS(col_1 int, col_2 int, co_5 string);

3、导数据

从本地文件导入到表

LOAD DATA LOCAL INPATH '/home/aaa.txt' OVERWRITE INTO TABLE table;

从hdfs导入

 LOAD DATA INPATH '/xxx/yyy/zzz.txt' OVERWRITE INTO TABLE table_a;

添加表分区

ALTER TABLE table_a ADD IF NOT EXISTS PARTITION (type='aa') LOCATION '/xxx/yyy/zzz';

从查询结果导入表

 INSERT OVERWRITE TABLE table_a SELECT * FROM table_b ;

从查询结果导入分区

INSERT OVERWRITE TABLE table_a PARTITION(type='aaa')

从表导数据到本地

INSERT OVERWRITE LOCAL DIRECTORY '/tmp/zzz.txt' SELECT * FROM table_a;

4、查询

查找表

SHOW TABLES;
SHOW TABLES like '*table*';

显示表结构

desc table_a;

显示表创建信息

show create table table_a;

数据查询

select * from table_a;

关联查询

select a.* from table_a join table_b on table_a.id=table_b.id;

查看hive为某个查询使用多少个MapReduce作业

Explain SELECT a.* FROM table_a JOIN table_b ON (table_a.id = table_b.id);

5、分区刷新

MSCK REPAIR TABLE table_a;

MSCK: Hive's MetaStore Consistency checK

posted @ 2020-09-11 17:12 繁忙的蜜蜂阅读(54) 评论(0) 收藏举报

刷新页面返回顶部

繁忙的蜜蜂

hive 常用命令

1、创建表

内部表

外部表

分区表

2、修改表

表重命名

增加一个字段

修改字段

删除字段

3、导数据

从本地文件导入到表

从hdfs导入

添加表分区

从查询结果导入表

从查询结果导入分区

从表导数据到本地

4、查询

查找表

显示表结构

显示表创建信息

数据查询

关联查询

查看hive为某个查询使用多少个MapReduce作业

5、分区刷新

公告