随笔分类 -  hive

摘要:#!/bin/bash id=`hive -e "set hive.cli.print.header=false;select id,name from test.test where name = 'wangwu' group by id,name;"` echo echo $id echo 阅读全文
posted @ 2021-07-20 17:38 快乐的张小凡 阅读(83) 评论(0) 推荐(0) 编辑
摘要:select size(m), --求map的长度 map_keys(m), --将map中对应的所有keys.存储格式为array map_values(m), --将map中对应的所有values sort_array(map_keys(m)), --对map的keys进行排序 array_co 阅读全文
posted @ 2021-06-07 09:29 快乐的张小凡 阅读(1074) 评论(0) 推荐(0) 编辑
摘要:语法: split(string str, string pat)返回值: array说明: 按照pat字符串分割str,会返回分割后的字符串数组举例:1.基本用法 hive> select split('abcdef', 'c') from test;["ab", "def"]2.截取字符串中的某 阅读全文
posted @ 2021-06-07 09:25 快乐的张小凡 阅读(8044) 评论(0) 推荐(0) 编辑
摘要:文件数目过多,会给HDFS带来压力,并且会影响处理效率,可以通过合并Map和Reduce的结果文件来消除这样的影响: set hive.merge.mapfiles = true ##在 map only 的任务结束时合并小文件 set hive.merge.mapredfiles = false 阅读全文
posted @ 2021-05-22 14:13 快乐的张小凡 阅读(536) 评论(0) 推荐(0) 编辑
摘要:yyyy-MM-dd与yyyyMMdd000000转换的三种方法 方法一:date_format(只支持yyyy-MM-dd -> yyyyMMdd000000) select date_format('2019-10-07', 'yyyyMMdd000000') -- 20191007000000 阅读全文
posted @ 2021-04-21 10:56 快乐的张小凡 阅读(1878) 评论(0) 推荐(0) 编辑
摘要:refresh table tablename ;MSCK REPAIR TABLE table_name;在更改分区内的文件后刷新表 refresh table tablename ; 我们平时通常是通过alter table add partition方式增加Hive的分区的,但有时候会通过HD 阅读全文
posted @ 2020-11-22 22:25 快乐的张小凡 阅读(363) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示