摘要:
[TOC] 一、HBase是什么 HBase是建立在Hadoop文件系统之上的分布式面向列的数据库。它是一个开源项目,是横向扩展的。 HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据。它利用了Hadoop的文件系统(HDFS)提供的容错能力。 它是Hadoop的生态 阅读全文
摘要:
[TOC] 一、Hadoop 介绍 Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 1、HDFS 介绍 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System) 阅读全文
摘要:
[TOC] 一、Zookeeper功能简介 ZooKeeper 是一个开源的分布式协调服务,由雅虎创建,是 Google Chubby 的开源实现。分布式应用程序可以基于 ZooKeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、配置维护,名字服 阅读全文
摘要:
[TOC] 一、软硬件规划 | ID | 主机类型 | 主机名 | IP | 应用软件 | 操作系统 | 硬件配置 | | | | | | | | | | 1 | 物理机 | namenode01 | 192.168.1.200 | jdk1.8.0_171、hadoop 2.7.3、hive 2. 阅读全文