返回顶部 Fork me on GitHub

随笔分类 -  Hive

摘要:一 Hive SQL练习之影评案例 案例说明 现有如此三份数据:1、users.dat 数据格式为: 2::M::56::16::70072, 共有6040条数据对应字段为:UserID BigInt, Gender String, Age Int, Occupation String, Zipco 阅读全文
posted @ 2018-08-12 18:54 Frankdeng 阅读(10939) 评论(1) 推荐(4) 编辑
摘要:一、Fetch抓取 1、理论分析 Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。 在hive-default 阅读全文
posted @ 2018-08-12 18:32 Frankdeng 阅读(18827) 评论(2) 推荐(7) 编辑
摘要:一、Hive 执行过程概述 1、概述 (1) Hive 将 HQL 转换成一组操作符(Operator),比如 GroupByOperator, JoinOperator 等 (2)操作符 Operator 是 Hive 的最小处理单元 (3)每个操作符代表一个 HDFS 操作或者 MapReduc 阅读全文
posted @ 2018-07-14 12:04 Frankdeng 阅读(5656) 评论(1) 推荐(0) 编辑
摘要:一、Hive的命令行 1、Hive支持的一些命令 Command Description quit Use quit or exit to leave the interactive shell. set key=value Use this to set value of particular c 阅读全文
posted @ 2018-06-10 14:25 Frankdeng 阅读(2125) 评论(0) 推荐(1) 编辑
摘要:一数据准备 cookie1,2015-04-10,1 cookie1,2015-04-11,5 cookie1,2015-04-12,7 cookie1,2015-04-13,3 cookie1,2015-04-14,2 cookie1,2015-04-15,4 cookie1,2015-04-16 阅读全文
posted @ 2018-06-10 13:42 Frankdeng 阅读(1502) 评论(0) 推荐(0) 编辑
摘要:一内置函数 1 数学函数 Return Type Return Type Name (Signature) Name (Signature) Description Description DOUBLE round(DOUBLE a) Returns the rounded BIGINT value 阅读全文
posted @ 2018-06-10 13:39 Frankdeng 阅读(2879) 评论(0) 推荐(1) 编辑
摘要:一、数据类型 1、基本数据类型 Hive 支持关系型数据中大多数基本数据类型 和其他的SQL语言一样,这些都是保留字。需要注意的是所有的这些数据类型都是对Java中接口的实现,因此这些类型的具体行为细节和Java中对应的类型是完全一致的。例如,string类型实现的是Java中的String,flo 阅读全文
posted @ 2018-06-10 13:15 Frankdeng 阅读(6424) 评论(0) 推荐(0) 编辑
摘要:一、CLI连接 进入到 bin 目录下,直接输入命令: 启动成功的话如上所示,接下来便可以做 hive 相关操作 补充: 1、上面的 hive 命令相当于在启动的时候执行:hive --service cli 2、使用 hive --help,可以查看 hive 命令可以启动那些服务 3、通过 hi 阅读全文
posted @ 2018-06-10 11:15 Frankdeng 阅读(1812) 评论(0) 推荐(0) 编辑
摘要:概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理。上一篇hive的安装也是将元数据信息存放在MySQL数据库中。 Hive的元数据信息在MySQL数据中有57张表 一、存储Hive版本的元数据表(VERSION) VERSION -- 查询版本信息 该表比较 阅读全文
posted @ 2018-06-10 10:12 Frankdeng 阅读(6309) 评论(0) 推荐(1) 编辑
摘要:一 Hive的下载 软件下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hive/ 这里下载的版本是:apache-hive-2.3.3-bin.tar.gz 官方安装配置文档:https://cwiki.apache.org/confluence/ 阅读全文
posted @ 2018-06-09 22:09 Frankdeng 阅读(6543) 评论(0) 推荐(1) 编辑
摘要:一 Hive 简介 什么是Hive 1、Hive 由 Facebook 实现并开源 2、是基于 Hadoop 的一个数据仓库工具 3、可以将结构化的数据映射为一张数据库表 4、并提供 HQL(Hive SQL)查询功能 5、底层数据是存储在 HDFS 上 6、Hive的本质是将 SQL 语句转换为 阅读全文
posted @ 2018-06-09 21:13 Frankdeng 阅读(1920) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示