返回顶部 Fork me on GitHub
摘要: 一、安装前提 1、HBase 依赖于 HDFS 做底层的数据存储 2、HBase 依赖于 MapReduce 做数据计算 3、HBase 依赖于 ZooKeeper 做服务协调 4、HBase源码是java编写的,安装需要依赖JDK 1、版本选择 打开官方的版本说明http://hbase.apac 阅读全文
posted @ 2018-08-12 21:49 Frankdeng 阅读(5090) 评论(1) 推荐(1) 编辑
摘要: 一 数据仓库的概念 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。 阅读全文
posted @ 2018-08-12 19:52 Frankdeng 阅读(29444) 评论(2) 推荐(2) 编辑
摘要: 一 Hive SQL练习之影评案例 案例说明 现有如此三份数据:1、users.dat 数据格式为: 2::M::56::16::70072, 共有6040条数据对应字段为:UserID BigInt, Gender String, Age Int, Occupation String, Zipco 阅读全文
posted @ 2018-08-12 18:54 Frankdeng 阅读(10797) 评论(1) 推荐(4) 编辑
摘要: 一、Fetch抓取 1、理论分析 Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。 在hive-default 阅读全文
posted @ 2018-08-12 18:32 Frankdeng 阅读(18554) 评论(2) 推荐(7) 编辑