HBase轻松入门之HBase架构图解析
2018-12-13
2018-12-20
本篇文章旨在针对初学者以我本人现阶段所掌握的知识就HBase的架构图中各模块作一个概念科普。不对文章内容的“绝对、完全正确性”负责。
1、开胃小菜
关于HBase的架构图,直接抓取网络上图片来分析就好了。它大概长成下面的样子:
图1 HBase架构图
从上图中可以很直观地看到整个HBase都是基于HDFS之上的。这个HDFS呢,它的全称是Hadoop distributed file system,Hadoop分布式文件系统。关于在《HBase入门指南》中提到的HBase的概念:HBase是一个用于处理大数据的分布式数据库软件。它的分布式特性在这张架构图中已经很直观地体现出来了,并且它的分布式能力是由Hadoop来提供并保证的。(其实哦,HBase的分布式能力并不一定非得基于HDFS的,理论上你任意一个分布式软件都能用来给HBase“基于”用,只不过由于HDFS太流行了,加上大多数的人其实都挺忙的,不喜欢瞎折腾,就拿HDFS来凑合过呗还能换咋的。。。)
上面图1其实挺零乱挺复杂的,对于这么复杂的一张图,小白同学表示他刚一进来,什么都不知道,就看到常威在打来福。。。哦哦,不是,小白同学说本来我学HBase的干劲挺足的,但刚开始就看到这张图,着实很打击小白同学的自信心啊。既然如此,那我们就来稍微给它简化一下。图1中的各种元素其实都是有它们各自的派系的,稍微划分一下派系后后它大概长成下图2的样子:
图2 HBase架构派系划分
上图2给这个架构图加了几个框框,把它们分成了四个派系A, B, C, D。这个框框虽然很不明显,但是眼睛睁大点还是能看清的,就当锻炼锻炼视力了。
A派系呢就像是王自如的Zealer手机测评团队一样,是独立客观以及第三方的。它就是上帝,A呢就是B, C, D存在的意义。
B派系是Zookeeper,它是用来保证HBase集群的一致性的。
C派系就是HBase集群了。有些同学可能发现了,C派系HBase中好像霸占了架构图中Zookeeper的一部分啊,这是画错了吗?非也,其实之所以这样划分,是因为现在的HBase软件体系中已经集成了有Zookeeper模块了,在默认的情况下,你不需要下载一个额外的Zookeeper软件,也能够正常运行HBase系统,并且拥有一个Zookeeper相关的进程。因此C派系中也占有了一丢丢Zookeeper的内容。但是其实是生产环境中,很少会用HBase自带的Zookeeper的。
D派系呢,就是任劳任怨的HDFS了。
上面简单的了解了一下HBase架构图中的各大派系,相信到这里,各位小白同学能够稍微对这张HBase的架构图不那么陌生了。什么?上面的图还是太恶心?好吧,那我们再进一步的处理一下这张图片,这次我直接放大招,把HBase架构图抽象一下,排除一切外在干扰,就不信你还看不懂它们之间的关系。看下图:
图3 HBase架构图抽象版
2、架构图详解
继续继续,下面要详细讲讲图1 HBase架构中各模块的含义了,这部分的内容就相当让人脑阔疼咯。我们以上帝视角,从客户端Client自上往下讲起。
2.1、Client
首先还是要来了解一下概念。Client到底是什么东东?
从广义的角度来说, Client其实就是你自己,Client是人!上面我们才刚刚讲过,B, C, D,也就是Hadoop, HBase以及Zookeeper存在的意义就是要服务于A,也就是Client,也就是人。假如都没有人去操作这个HBase系统了,那你HBase系统的功能再强大又有什么意义呢?有的同学可能要抬杠了,说人家企业里的HBase系统,都是无人植守,按照程序自动去运行,一样跑的很嗨啊,哪像你说的那样,没有人去操作HBase系统就没有意义了。好的,这位同学请坐下。这些跑的很嗨的程序还不是由人去写的。。程序其实就是人类的意志的产物而已,程序怎么跑还不是由人说了算。所以,归根结底。无论是你坐在电脑前对着hbase shell敲命令行,还是自己写代码去操纵HBase,亦或是在地球的另一端通过各种软件来向HBase下达指令,你就是Client。
那从狭义的角度来说,我们下到代码层面来说,Client是HBase开放出来给程序员们使用的各种API接口。Client也像是一个承上启下的角色,对上要接收来自人的意志,对下要将人的意志转化成一条条HBase程序并逐一执行。
那说了这么多,Client在HBase系统中有什么用呢?其实它只有一个作用。
- 它是整个HBase系统的入口。
在代码层面来讲,它就是各种API接口。有了这些接口,我们就可以实现对数据的CURD,甚至是发送一些管理级的命令。
2.2、Zookeeper
Zookeeper也是Apache软件基金会中的一个顶级项目。它是给分布式系统提供协同服务的软件。协同服务是什么鬼?也许会有不少人对这个词很陌生。下面我们就来解释一下什么是协同服务。
Zookeeper从字面上翻译过来就是:动物园管理员。那为什么会起这么个名字呢?原来啊Apache软件基金会下面关于分布式的软件有很多,它们基本都会联系上一种动物,或名字或LOGO。如Hadoop(小象象),Pig(油腻猪),Hive(怪蜜蜂),HBase(酷海豚)等等等等。那么,在分布式应用当中,同步无疑是其最重要的特性,常有的同步包括:
1、配置同步;
2、时间同步;
3、相互感知(集群中各主机的上线下线消息及各种状态)。
上面提到的这几个“同步”就是“协同”的白话语言。
而为了 blah,blah,blah... 就需要一个Zookeeper来专门负责这种“同步服务”。
除了“同步服务”以外,Zookeeper还保存着HBase系统中的配置信息。什么配置信息呢?
1、master与slaver机器的信息
地址啊端口啊这些。
HMaster可以通过查询Zookeeper来了解当前哪些slaver还在正常工作当中。
假如当前master宕机了,Zookeeper还可以通过保存着的backup master的信息来重新推选出一个新的master,起到保证HBase系统高可用性的作用。
2、保存 hbase:meta 表所在的位置
hbase:meta 表在HBase中是非常重要的一张表,它是由HBase系统创建并维护的。这里暂且记住它非常重要就好了。
3、保存HBase系统中所有的表信息
假如客户端发起一个CRUD请求,首先要知道这张表存不存在吧,又保存在哪吧。通过Zookeeper就可以实现非常快速的响应,因为整个Zookeeper都是驻留在内存中的。
4、其它信息
还有各种杂七杂八但很重要的信息,都由Zookeeper来保存。
因此,Zookeeper在HBase系统中就是用于给运行在不同机器上的HBase程序提供协同服务的。
2.3、HBase
HBase模块个人理解它就像是一个装饰器。把原本HDFS(Hadoop distributed file system)的功能用“数据库的语言”来复述一遍。它在集群中共有两个进程:1. HMaster; 2. HRegionServer。整个架构图中HBase部分这么繁杂,概括出来其实也就两个东东而已。。。
2.3.1、HMaster
首先在这里先简单了解一下“HBase集群”的概念。HBase集群中有若干台计算机,其中有一台是“主机(Master)”,其余的都是“从机(Slaver)”。一般在生产系统中,还会有一台“备用主机(backup master)”。
这个HMaster进程,就是运行在“主机”上的。准确的说,应该是HMaster在哪一台计算机上运行,哪一台计算机就是“主机”。
HMaster既然作为一个“上位者”,那它肯定是轻易不会去干活的,不然领导的尊严何在?类比一下企业当中的master,他们的日常工作就对外搞搞外交,对内签签名,再视察一下各部门的工作情况,还会根据企业现阶段的发展状况作一下资源调度等等。那我们的HBase当中也基本一样,唯一的不同就是HMaster不用去外面搞外交,它只处理自己HBase系统内部的事务。
HMaster的作用主要有以下几个:
1、分发Region
首先,Region是什么?在HBase中,如果一张表所包含的内容超过设定的上限,即一张表很大的话,会将这张表水平地分成两半。比如,某张表共有1000行20列数据,HBase嫌这张表太大了,影响我检索效率。将它分成两部分,第一部分内容为第1 ~ 499行。第二部分内容为第500 ~ 1000行。那这切分出来的部分,就被称为Region。在这里,就是有两个Region。
其次,HBase系统会将这些Region尽量均衡地分发给这些“从机(Slaver)”。让集群中每台从机都干同样多同样重的活。这可以说是HMaster的首要任务。
2、监控HRegionServer
* 负责HRegionServer的故障转移
HRegionServer会定期地向HMaster发送心跳报告。当HMaster收不到HRegionServer的消息时,就认为该HRegionServer已经失去作用了。这个时候HMaster就得下达指令,将原本在HRegionServer上的数据迁移到其它正常工作的机器上去。到这里你肯定会有个疑问:根据前面讲到的判断HRegionServer故障的方式来看,这个时候HMaster已经不能够和该HRegionServer通信了,那你是怎么下达指令,让原本在这台HRegionServer上的数据进行迁移的呢?这个问题,这里暂且不讲,我们只要知道,它能够做到就是了。刚开始接触,不要一下子灌输太多概念,很容易乱的。HDFS的好处在这就体现出来了。
* 负责HRegionServer的负载均衡
当HBase系统中某台机器上的某个Region的大小超过上限时,它会被RegionServer切割成两半,切割后多出来的一个Region又会由HMaster根据集群的情况来做负载均衡,其目的就是尽可能地让每台从机干同样多同样重的活。这里还有一个:RegionServer中由“小合并”“大合并”生成的Region也会需要HMaster来做负载均衡。
那这里又有一个新的疑问:HMaster是如何得知HRegionServer是忙还是闲的呢? HRegionServer会定期向HMaster发送一份自己的运行报告,类似于企业当中各部门领导定期向老板递交工作报告一样。然后HMaster就汇总这些运行报告并分析从而作出决策并最终下达指令。
3、管理元数据
在HBase中有一个由系统创建的表: hbase:meta 。这里我们姑且称它为“元数据表”。那这个“元数据表”是干什么用的呢?
原来啊,在HBase中,所有的数据都是以“表”的形式来管理的。而当你的表增长到一定程度的时候,它会影响到你CRUD的效率。举个粟子,假设你的某张表A里有1亿条数据,现在你要查询其中一条数据。又假设你又有一张表B里面有1000条数据,同样你要查询其中一条数据,你说A和B哪个检索速度快?因此,当你的表增长到一定程度时,HMaster就会把这个表切割成几块,假设有一张表共有1000行,HMaster把它分割成两块T1和T2,T1的数据范围从第0行到第499行。T2的数据范围从第500行到第999行。不同的块根据负载均衡存储在不同的HRegionServer中。然后你要查询某一条数据的话,就首先确定你这条数据是坐落在哪一个“块”当中的,确定好后直接去这个“块”当中查询,这样检索速度就快很多了。那么,这些不同的“块”被分别存储到哪个HRegionServer中呢?这些不同的“块”又是包含了哪些范围的数据呢?这些信息就是记载在这个 hbase:meta 也就是“元数据”表中的了。一句大白话总结:元数据表是负责记载你想要查询的数据是在哪台HRegionServer上保存着的信息的。
那话说回来,HMaster对于“元数据表”的管理方式,就是负责更新这个表中的数据内容的咯,换句话说就是如果HMaster挂掉了,那这个hbase:meta的数据就停止更新了。
2.3.2、HRegionServer
HRegionServer就复杂咯。。。
我们还是再来看看HRegionServer的架构图吧。
图4 HRegionServer架构图
首先呢要明确一个概念:一个HRegionServer就代表着一台计算机。我们这里所讲的一切都是基于这个大前提来讲的。事实上确实也是,一台计算机上就运行一个HRegionServer进程,我不确定会不会有运行两个HRegionServer进程的计算机,但是我觉得既然你要玩分布式,一台机器上跑两个HRegionServer就没有分布式的意义了。
接着我们来看一下HRegionServer中都有哪些东西。A picture is worth than a thousand words.
图5 HRegionServer组成
下面来了解了解HRegionServer的各个组成部分的基本概念。。。
1、 HLog
首先,一个HRegionServer中就只有一个HLog。
HLog它是采用一种叫做预写日志(write-ahead logging,简称WAL)的方式来记录数据的日志文件。数据在这个日志文件里起到一个备份的作用,它是用来作容灾的。HLog也是存储在HDFS上的。
当Client想要写数据到HBase数据库中时,数据首先会写到这个HLog中。当数据在HLog中成功保存以后就会告诉客户端:我已经成功保存好你要我保存的数据了。随后进行下一步的保存操作。需要注意的是,数据成功保存进HLog中以后,仅仅完成了HBase数据存储的三分之一而已。但在这里,不讲这么多。
2、HRegion
一个HRegionServer中有0 ~ n个HRegion。HRegion同HRegionServer一样,在计算机中都只是一段程序而已。一个HRegion代表着一个从“表”中分割出来的“块”,即HRegion代表着Region。很费解吧!HRegion是一段程序,Region是一小段逻辑表数据。每一个HRegion内部又维护着0 ~ n个Store,结合上图5来看,这部分非常的绕。一个Store呢就代表着一个列族。什么是列族?在这里先简单地把它理解成是“好几个列的集合”。同时,每一个Store内部又维护着一个MemStore和0 ~ n个StoreFile。这个MemStore是一段内存空间。而这个StoreFile就是HFile,是最终存储数据用的在HDFS之上的真实文件。就是说,假如你往HBase中保存了你心仪小姐姐的照片,那么这个照片最终会被存储到某一个HFile文件中。
这里我们再来淡淡HRegionServer是如何存储数据的。前面在HLog部分只讲了HBase数据存储的三分之一。HRegionServer在收到数据存储的请求以后,首先会将这些要被存储的数据写到HLog中。当HLog中写成功以后,再将这些数据写到MemStore中。而MemStore由于是内存,你往内存中写数据那速度就快了,在往内存中也写成功以后呢,HRegionServer就要向Client返回一个“我已经把你要我保存的数据保存起来了”的信号了。但是实际上HRegionServer在“骗”你。这个时候你如果到HDFS的后台上去看,你根本找不到你要保存的那段数据的文件。换句话说,HBase之所以要管理起大数据来速度这么快,很大一部分功劳在于它是一个很“狡猾的骗子”。HRegionServer啊,只有在MemStore中存储的数据达到一定的量以后,才会一次性的将这些数据输出到HFile中。其实这种方式优点还是很明显的,既以提升“Client的响应”速度,又能减少IO操作,在数据存储中,减少IO就意味着延长存储介质的寿命,存储介质寿命延长了更意味着企业能降低运维成本。厉害了。。。
好了关于HBase的存储流程,当然没有这么简单,但是在这里仅需要简单地了解这些就够了,慢慢来嘛,整个HBase系统可是比女人心还要复杂的,一下子让你接受太多,恐怕你要受不住啊。。。
在知道了HRegionServer的组成以后,就可以了解了解HRegionServer的职责了。
1、托管数据
前面我们已经知道了HMaster它只负责作决策。实际的数据存储的工作则全部交由HRegionServer来做。即HRegionServer就是用来存储实际数据的。
2、维护HLog
负责更新或删除HLog中的内容。HLog是直接按行存储的,即只要你客户端发送一次存储请求过来,我都直接在HLog的末尾按一定格式添加进去,不给你分类。并且在这些数据内容被持久化到HDFS中以后,会删除掉HLog中对应的信息。
3、大、小合并。
就是minor compaction与major compaction。简言之,如果HBase系统中小文件太多了,将它合并成一个大一点的文件。
4、监控Region
HRegionServer监控Region的什么东西呢? 当然是监控它的尺寸了。你想想嘛,HBase就是号称针对大数据高速检索的数据库,你一个Region要是过于庞大那就是一个文件过于庞大,那它还怎么来保证大数据的高速检索。HRegionServer会定期将自己管辖的Region的尺寸数据生成一个报告发给HMaster。如果HMaster发现某个Region过大了,就要下达指令,让HRegionServer将这个Region分割成2块。下达分割指令的是HMaster,指令的执行者是RegionServer。
2.4、Hadoop
Hadoop也是Apache软件基金会的顶级项目。它是一个分布式系统架构。
它在HBase系统中就负责帮RegionServer以分布式的方式管理各个HFile文件。
再说的通俗一点吧。把整个HBase系统比喻成一家企业。Master是这家企业的老板,Slaver可以比喻成是公司财务。数据比喻成是资金。由老板下达决策,将所有资金划拨到不同用途。财务负责帮老板管钱。那这么多的钱,财务精力有限能力有限,不可能自己管的过来啊。那怎么办?只能交给银行来管了。Hadoop,也就是HDFS就起到类似于银行的角色。
这篇文章已经够长了,就只聊这么多了。个人认为,如果你是一个初学者的话,就不要一下子灌输太多的概念,一来很难消化的了这么多内容,二来容易打击自己的积极性。只了解一个基本的概念,详细的知识可以在后面的使用过程中慢慢学习。这里尤其千万要告诫你们的一点就是:初学者不要接触HBase源代码。不解释,信我,没错的。
- The end -