Hive笔记之数据库操作

创建数据库

hive创建数据库的最简单写法和mysql差不多：

create database foo;

仅当名为foo的数据库当前不存在时才创建：

create database if not exists foo;

创建数据库时指定位置，这个位置一般是在hdfs上的位置：

create database foo location '/db/foo';

查看已经创建的数据库：

show databases ;

使用通配符查看foo开头的数据库：

show databases like 'foo.*';

查看创建数据库的语句：

show create database foo ;

hive为每一个数据库创建一个目录，这个数据库中的表将会以子目录的形式放在这个数据库目录下

有一个例外就是default数据库中的表，default数据库没有自己的目录，所以是直接放在/user/hive/warehouse下面的：

同样的，当创建数据库如果没有指定存储位置，默认就是在/user/hive/warehouse/下的：

数据库描述信息

在创建数据库时可以指定描述性信息：

create database foo comment 'this is foo database';

通过describe database可以查看到数据库的详细信息：

describe database foo;

数据库键值对信息

数据库可以有一些描述性的键值对信息，在创建时添加：

create database foo with dbproperties ('own'='cc', 'day'='20180120');

查看数据库的键值对信息：

describe database extended foo;

要修改数据库的键值对信息：

alter database foo set dbproperties ('k1'='v1', 'k2'='v2');

删除数据库

drop database if exists foo;

注意：

默认情况下是不允许直接删除一个有表的数据库的：

删除一个有表的数据库有两种办法：

1. 先把表删干净，再删库。

2. 删库时在后面加上cascade，表示级联删除此数据库下的所有表：

drop database if exists foo cascade;

prompt显示当前数据库名称

如果在一个数据库很多的环境下工作，需要在不同的库之间切来切去（手动敲查询的时候全使用dbName.table可不是什么好主意…），可能一不小心就忘记自己当前在哪个数据库下了，可以通过设置一个属性改变当前的命令提示符，更专业的说法是prompt（用过CLI界面的应该对这个概念很熟悉），通过设置hive.cli.print.current.db属性可以在hive cli中显示当前数据库的名称，比如当前的数据库名称是foo：

set hive.cli.print.current.db=true

posted @ 2018-05-13 23:16 CC11001100 阅读(22941) 评论(0) 收藏举报

刷新页面返回顶部