Hive笔记

1、

内部表：load data inpath

<1.把文件移动到了/user/hive/warehouse/数据库名/表名/文件名

<2.Drop table：会删除/user/hive/warehouse/数据库名/表名文件名
外部表:location ‘文件夹’
<1.create table。。Location文件还是在原来目录下，并未移动到hive工作目录下
<2.Drop table：只会删除hive元数据库中表的信息，并没有真正删除源文件。

2、

配置如下参数，可以开启Hive的本地模式：
hive> set hive.exec.mode.local.auto=true;(默认为false)

3、

当一个job满足如下条件才能真正使用本地模式：
<1.job的输入数据大小必须小于参数：hive.exec.mode.local.auto.inputbytes.max(默认128MB)
<2.job的map数必须小于参数：hive.exec.mode.local.auto.tasks.max(默认4)
<3.job的reduce数必须为0或者1

4、

Hive 的内置数据类型可以分为两大类：

(1)、基础数据类型：tinyint,smallint,int,bigint,boolean,float,double,string,binary,timestamp,decimal,char,varchar,date

(2)、复杂数据类型 : 包括array,map,struct,union，这些复杂类型是由基础类型组成的。

ARRAY：ARRAY类型是由一系列相同数据类型的元素组成，这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits，它是由['apple','orange','mango']组成，那么我们可以通过fruits[1]来访问元素orange，因为ARRAY类型的下标是从0开始的；
MAP：MAP包含key->value键值对，可以通过key来访问元素。比如”userlist”是一个map类型，其中username是key，password是value；那么我们可以通过userlist['username']来得到这个用户对应的password；
STRUCT：STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素，比如user是一个STRUCT类型，那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE，他是从Hive 0.7.0开始支持的。

希望采纳~~~~

posted @ 2018-09-06 11:27 BoomOoO 阅读(201) 评论(0) 收藏举报

刷新页面返回顶部

BoomOoO

Hive笔记

公告