随笔分类 - Hive
摘要:第九章 企业级调优 9.1 Fetch抓取 9.2 本地模式 大多数的Hadoop Job是需要Hadoop提供的完整的可扩展性来处理大数据集的。不过,有时Hive的输入数据量是非常小的。在这种情况下,为查询触发执行任务消耗的时间可能会比实际job的执行时间要多的多。对于大多数这种情况,Hive可以
阅读全文
摘要:第七章 函数 7.1 系统内置函数 1.查看系统自带的函数 show functions; 2. 显示自带的函数的用法 desc function 函数名; 3. 详细显示自带的函数的用法 desc function extended 函数名; 7.2 自定义函数 1)Hive 自带了一些函数,比如
阅读全文
摘要:6.5 排序 6.5.1全局排序(Order by) Order By 全局排序,一个Reducer 1,使用Oerder by 子句排序 ASC(ascend) : 升序(默认) DESC(descend):降序 2,ORDER BY 子句在SELECT语句的结尾 3,案例实操: (1)查询员工信
阅读全文
摘要:第六章 查询 查询语句语法: SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list] [ORDER BY col_li
阅读全文
摘要:DML数据操作 5.1 数据导入 5.1.1 向表中装载数据(Load) 1.语法 hive load data [local] inpath '/opt/module/datas/studnets.txt' overwrite | into table student [partition(par
阅读全文
摘要:DDL数据定义 创建数据库 1)创建一个数据库,数据库在HDFS上的默认存储路径是/user/hive/warehouse/ .db。 2)避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法) create database if not exists db_hive;
阅读全文
摘要:Hive数据类型 基本数据类型 对于Hive的String 类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多存储多少个字符,理论上可以存储2GB的字符数。 3.2集合数据类型 Hive有三种复杂数据类型ARRAY,MAP, STRUCT. ARRAY和MAP与J
阅读全文
摘要:Hive安装 2.1 Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.下载地址 http://archive.
阅读全文
摘要:第一章:Hive入门 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质:将HQL转化为MapReduce程序 1)hive处理的数据存储在HDFS
阅读全文