Hive笔记
1、
内部表:load data inpath
<1.把文件移动到了/user/hive/warehouse/数据库名/表名/文件名
<2.Drop table:会删除/user/hive/warehouse/数据库名/表名文件名
外部表:location ‘文件夹’
<1.create table。。Location文件还是在原来目录下,并未移动到hive工作目录下
<2.Drop table:只会删除hive元数据库中表的信息,并没有真正删除源文件。
2、
配置如下参数,可以开启Hive的本地模式:
hive> set hive.exec.mode.local.auto=true;(默认为false)
3、
当一个job满足如下条件才能真正使用本地模式:
<1.job的输入数据大小必须小于参数:hive.exec.mode.local.auto.inputbytes.max(默认128MB)
<2.job的map数必须小于参数:hive.exec.mode.local.auto.tasks.max(默认4)
<3.job的reduce数必须为0或者1
4、
Hive 的内置数据类型可以分为两大类:
(1)、基础数据类型:tinyint,smallint,int,bigint,boolean,float,double,string,binary,timestamp,decimal,char,varchar,date
(2)、复杂数据类型 : 包括array,map,struct,union,这些复杂类型是由基础类型组成的。
ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
MAP:MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;
STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。
希望采纳~~~~