摘要: 一、MySQL的安装 Hive的数据,是存在HDFS里的。此外,hive有哪些数据库,每个数据库有哪些表,这样的信息称之为hive的元数据信息。 元数据信息不存在HDFS,而是存在关系型数据库里,hive默认用的是derby数据库来存储。即hive工作时,除了要依赖Hadoop,还要依赖关系型数据库 阅读全文
posted @ 2019-08-07 23:43 coder、 阅读(5802) 评论(0) 推荐(0) 编辑
摘要: 一、安装说明 ①下载mysql的安装包 我这里已经放入网盘:https://pan.baidu.com/s/1Orl71Tk9J-TIznGaJuldhQ https://pan.baidu.com/s/1ElUU4mg0SBlupfUantu5yA ②确认当前环境是否安装过mysql rpm -q 阅读全文
posted @ 2019-08-07 23:20 coder、 阅读(796) 评论(0) 推荐(0) 编辑
摘要: 一、Hive安装 Hive的安装相对比较简单,Hive是基于Hadoop来使用的,所以搭建Hadoop伪分布式或完全分布式即可,Hive安装过程如下: ①安装并启动Hadoop 在博主的其他博客中有安装说明:Hadoop之伪分布式安装 ②获取Hive安装包,并解压 下载地址:https://mirr 阅读全文
posted @ 2019-08-07 22:44 coder、 阅读(260) 评论(0) 推荐(0) 编辑
摘要: 一、数据库和数据仓库 二、OLTP和OLAP对比 ①OLTP(OnLine Transaction Processing)和OLAP(OnLine Analytical Processing) 数据库属于OLTP系统(联机事务处理系统),覆盖了企业大部分的日常操作,比如:购物、库存、银行、工资、记账 阅读全文
posted @ 2019-08-07 22:13 coder、 阅读(380) 评论(0) 推荐(1) 编辑
摘要: 一、Hive介绍 Apache官网给出的logo,一半是Hadoop大象的头,一半是蜜蜂的身体,也是寓意着它是基于Hadoop,哈哈,纯属个人理解,进入正题。 Hive是基于Hadoop的一个数据仓库工具,可以将sql语句转换成MapReduce任务来运行。可以用来数据提取、转化、加载(ETL),这 阅读全文
posted @ 2019-08-07 21:51 coder、 阅读(1105) 评论(1) 推荐(1) 编辑
摘要: 一、HBase的安装模式 ①单机安装:不依赖于Hadoop的HDFS,配置完即可使用,好处是便于测试,坏处是不具备分布式数据存储的能力。 ②伪分布式安装:单台主机模拟真实环境。 ③完全分布式安装:多台主机(虚拟机)来搭建 二、搭建准备 ①搭建Hadoop+JDK+ZooKeeper(3个zookee 阅读全文
posted @ 2019-08-07 16:26 coder、 阅读(1389) 评论(0) 推荐(0) 编辑