随笔分类 -  Hive

摘要:第九章 企业级调优 9.1 Fetch抓取 9.2 本地模式 大多数的Hadoop Job是需要Hadoop提供的完整的可扩展性来处理大数据集的。不过,有时Hive的输入数据量是非常小的。在这种情况下,为查询触发执行任务消耗的时间可能会比实际job的执行时间要多的多。对于大多数这种情况,Hive可以 阅读全文
posted @ 2019-08-13 23:39 希音 阅读(195) 评论(0) 推荐(0) 编辑
摘要:第七章 函数 7.1 系统内置函数 1.查看系统自带的函数 show functions; 2. 显示自带的函数的用法 desc function 函数名; 3. 详细显示自带的函数的用法 desc function extended 函数名; 7.2 自定义函数 1)Hive 自带了一些函数,比如 阅读全文
posted @ 2019-08-13 22:46 希音 阅读(110) 评论(0) 推荐(0) 编辑
摘要:6.5 排序 6.5.1全局排序(Order by) Order By 全局排序,一个Reducer 1,使用Oerder by 子句排序 ASC(ascend) : 升序(默认) DESC(descend):降序 2,ORDER BY 子句在SELECT语句的结尾 3,案例实操: (1)查询员工信 阅读全文
posted @ 2019-08-12 23:20 希音 阅读(240) 评论(0) 推荐(0) 编辑
摘要:第六章 查询 查询语句语法: SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list] [ORDER BY col_li 阅读全文
posted @ 2019-08-11 22:58 希音 阅读(172) 评论(0) 推荐(0) 编辑
摘要:DML数据操作 5.1 数据导入 5.1.1 向表中装载数据(Load) 1.语法 hive load data [local] inpath '/opt/module/datas/studnets.txt' overwrite | into table student [partition(par 阅读全文
posted @ 2019-08-11 14:45 希音 阅读(130) 评论(0) 推荐(0) 编辑
摘要:DDL数据定义 创建数据库 1)创建一个数据库,数据库在HDFS上的默认存储路径是/user/hive/warehouse/ .db。 2)避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法) create database if not exists db_hive; 阅读全文
posted @ 2019-08-11 14:08 希音 阅读(162) 评论(0) 推荐(0) 编辑
摘要:Hive数据类型 基本数据类型 对于Hive的String 类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多存储多少个字符,理论上可以存储2GB的字符数。 3.2集合数据类型 Hive有三种复杂数据类型ARRAY,MAP, STRUCT. ARRAY和MAP与J 阅读全文
posted @ 2019-08-10 23:13 希音 阅读(130) 评论(0) 推荐(0) 编辑
摘要:Hive安装 2.1 Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.下载地址 http://archive. 阅读全文
posted @ 2019-08-10 23:04 希音 阅读(131) 评论(0) 推荐(0) 编辑
摘要:第一章:Hive入门 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 本质:将HQL转化为MapReduce程序 1)hive处理的数据存储在HDFS 阅读全文
posted @ 2019-08-10 22:57 希音 阅读(143) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示