摘要: 1.1.1 hive是什么? Hive是基于 Hadoop 的一个数据仓库工具: 1.1.2 hive和Hadoop关系 Hive利用HDFS存储数据,利用MapReduce查询数据,聚合函数需要经过MapReduce,非聚合函数直接读取hdfs块信息,不通过MapReduce。 1.1.3 hiv 阅读全文
posted @ 2019-01-21 10:50 星辰大海-sdifens 阅读(3983) 评论(0) 推荐(0) 编辑
摘要: HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。 HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统(HDFS)提供的容错能力。 它是Hadoop的生态系统,提供对数据的随机实时读/写访 阅读全文
posted @ 2019-01-21 10:37 星辰大海-sdifens 阅读(1797) 评论(0) 推荐(0) 编辑
摘要: Appache hadoop 版本:2.77 jdk:1.8 系统:centos7 注意不要在root下解压,要单独建一个用户安装hadoop及其组件。 一、先查看系统是否有自带j #dk: rpm -qa|grep java 通常是如下4个包: rpm -e --nodeps java-1.8.0 阅读全文
posted @ 2019-01-21 10:28 星辰大海-sdifens 阅读(533) 评论(0) 推荐(0) 编辑