hbase架构

1 HBase特点

1）海量存储

Hbase适合存储PB级别的海量数据，在PB级别的数据以及采用廉价PC存储的情况下，能在几十到百毫秒内返回数据。这与Hbase的极易扩展性息息相关。正式因为Hbase良好的扩展性，才为海量数据的存储提供了便利。

2）列式存储

这里的列式存储其实说的是列族存储，Hbase是根据列族来存储数据的。列族下面可以有非常多的列，列族在创建表的时候就必须指定。

3）极易扩展

Hbase的扩展性主要体现在两个方面，一个是基于上层处理能力（RegionServer）的扩展，一个是基于存储的扩展（HDFS）。

通过横向添加RegionSever的机器，进行水平扩展，提升Hbase上层的处理能力，提升Hbsae服务更多Region的能力。

备注：RegionServer的作用是管理region、承接业务的访问，这个后面会详细的介绍通过横向添加Datanode的机器，进行存储层扩容，提升Hbase的数据存储能力和提升后端存储的读写能力。

4）高并发

由于目前大部分使用Hbase的架构，都是采用的廉价PC，因此单个IO的延迟其实并不小，一般在几十到上百ms之间。这里说的高并发，主要是在并发的情况下，Hbase的单个IO延迟下降并不多。能获得高并发、低延迟的服务。

5）稀疏

稀疏主要是针对Hbase列的灵活性，在列族中，你可以指定任意多的列，在列数据为空的情况下，是不会占用存储空间的。

2.HBase架构

1）Client

Client包含了访问Hbase的接口，另外Client还维护了对应的cache来加速Hbase的访问，比如cache的.META.元数据的信息。

2）Zookeeper

HBase通过Zookeeper来做Hmaster的高可用、HRegionServer的监控、元数据的入口以及集群配置的维护等工作。具体工作如下：

通过Zoopkeeper来保证集群中只有1个HMaster在运行，如果HMaster异常，会通过竞争机制产生新的HMaster提供服务

通过Zoopkeeper来监控HRegionServer的状态，当HRegionSevrer有异常的时候，通过回调的形式通知HMaster HRegionServer上下线的信息

通过Zoopkeeper存储元数据的统一入口地址（比如哪些数据在哪个HRegionServer上），clint会先从ZK获取元数据信息。

3）HMaster

HMaster节点的主要职责如下：

为HRegionServer分配HRegion

维护整个集群的负载均衡

维护集群的元数据信息(和ZK各有一份)

发现失效的HRegion，并将失效的HRegion分配到正常的HRegionServer上

当HRegionSever失效的时候，协调对应Hlog的拆分

4）HRegionServer

HRegionServer直接对接用户的读写请求，是真正的“干活”的节点。它的功能概括如下：

管理HMaster为其分配的HRegion

处理来自客户端的读写请求

负责和底层HDFS的交互，存储数据到HDFS

负责HRegion变大以后的拆分（切的命令来自HMaster）

负责Storefile的合并工作

5）HDFS

HDFS为Hbase提供最终的底层数据存储服务，同时为HBase提供高可用（Hlog存储在HDFS）的支持，具体功能概括如下：

提供元数据和表数据的底层分布式存储服务

6）HRegion

Hbase表的分片，HBase表会根据RowKey值被切分成不同的region存储在RegionServer中，在一个RegionServer中可以有多个不同的HRegion。可以理解一个表对应一个HRegion(表太大就会切分成多个HRegion),一个列族又对应着一个HRegion中的Store（列族也会因为HRegion的切分对应多个store）。数据存储先存储在Men Store代表内存存储,再一定的时间或者数据量后以HFile的格式刷写到HDFS上（磁盘），文件叫StoreFil。写文件到HDFS需要访问HDFS Client。

7）Hlog(Write-Ahead logs)

HBase的修改记录，当对HBase读写数据的时候，数据不是直接写进磁盘，它会在内存中保留一段时间（时间以及数据量阈值可以设定）。但把数据保存在内存中可能有更高的概率引起数据丢失，为了解决这个问题，数据会先写在一个叫做Write-Ahead logfile的文件中，然后再写入内存中。所以在系统出现故障的时候，数据可以通过这个日志文件重建。

posted @ 2020-04-17 17:00 夏天换上冬装阅读(143) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

hbase架构

公告