05 2018 档案

摘要:hive的用户和用户权限 HiverServer2支持远程多客户端的并发和认证,支持通过JDBC、Beeline等连接操作。hive默认的Derby数据库,由于是内嵌的文件数据库,只支持一个用户的操作访问,支持多用户需用mysql保存元数据。现在关心的是HiveServer如何基于mysql元数据库 阅读全文
posted @ 2018-05-31 15:44 最最么么哒 阅读(6148) 评论(0) 推荐(1) 编辑
摘要:Hive 表分区 Hive表的分区就是一个目录,分区字段不和表的字段重复 创建分区表: create table tb_partition(id string, name string) PARTITIONED BY (month string) row format delimited field 阅读全文
posted @ 2018-05-31 14:33 最最么么哒 阅读(609) 评论(0) 推荐(0) 编辑
摘要:一、为什么要创建分区表1、select查询中会扫描整个表内容,会消耗大量时间。由于相当多的时候人们只关心表中的一部分数据, 故建表时引入了分区概念。2、hive分区表:是指在创建表时指定的partition的分区空间,若需要创建有分区的表, 需要在create表的时候调用可选参数partitione 阅读全文
posted @ 2018-05-31 14:23 最最么么哒 阅读(1602) 评论(0) 推荐(0) 编辑
摘要:它是一个特殊形式的 CONCAT() concat_ws(分隔符,参数1,参数2.。。。。。。) as 字段 返回值为一个数组 a.基本用法: 例1:split('a,b,c,d',',') 得到的结果:["a","b","c","d"] b.截取字符串中的某个值: 当然,我们也可以指定取结果数组中 阅读全文
posted @ 2018-05-28 14:26 最最么么哒 阅读(173) 评论(0) 推荐(0) 编辑