|NO.Z.00021|——————————|BigDataEnd|——|Hadoop&HBase.V05|——|HBase.v05|HBase原理|读写Flush阻塞|合并机制.v01|

一、HBase读数据流程
### --- [HBase]

~~~     [HBase原理深入之读数据流程]
~~~     [HBase原理升入之写数据流程]
~~~     [HBase的Flush机制及阻塞机制]
~~~     [HBase的Compact合并机制]

### --- HBase表中row可以按照字典序排序,切分region就是按照rowkey来划分

~~~     一张表3个region 
~~~     0-1000:region1
~~~     1001-2000 region2
~~~     2001-5000 region3  
hbase(main):001:0> scan 'hbase:meta'
ROW                                              COLUMN+CELL                                                                                                                                   
 hbase:namespace,,1630575261628.df94cbecb49bd001 column=info:regioninfo, timestamp=1630575563615, value={ENCODED => df94cbecb49bd00190eb0a1827cf5b01, NAME => 'hbase:namespace,,1630575261628.d
 90eb0a1827cf5b01.                               f94cbecb49bd00190eb0a1827cf5b01.', STARTKEY => '', ENDKEY => ''}                                                                              
 hbase:namespace,,1630575261628.df94cbecb49bd001 column=info:seqnumDuringOpen, timestamp=1630575563615, value=\x00\x00\x00\x00\x00\x00\x00\x0B                                                 
 90eb0a1827cf5b01.                                                                                                                                                                             
 hbase:namespace,,1630575261628.df94cbecb49bd001 column=info:server, timestamp=1630575563615, value=linux122:16020                                                                             
 90eb0a1827cf5b01.                                                                                                                                                                             
 hbase:namespace,,1630575261628.df94cbecb49bd001 column=info:serverstartcode, timestamp=1630575563615, value=1630575236665                                                                     
 90eb0a1827cf5b01.                                                                                                      
### --- HBase读操作

~~~     # 首先从zk找到meta表的region位置,
~~~     然后读取meta表中的数据,meta表中存储了用户表的region信息
~~~     # 根据要查询的namespace、表名和rowkey信息。
~~~     找到写入数据对应的region信息找到这个region对应的regionServer,然后发送请求查找对应的region
~~~     # 先从memstore查找数据,如果没有,
~~~     再从BlockCache上读取HBase上Regionserver的内存分为两个部分一部分作为Memstore,
~~~     主要用来写;另外一部分作为BlockCache,主要用于读数据;

~~~     # 如果BlockCache中也没有找到,
~~~     再到StoreFile上进行读取从storeFile中读取到数据之后,
~~~     不是直接把结果数据返回给客户端,而是把数据先写入到BlockCache中,
~~~     目的是为了加快后续的查询;然后在返回结果给客户端。
二、HBase写数据流程
### --- HBase写操作

~~~     首先从zk找到meta表的region位置,然后读取meta表中的数据,
~~~     meta表中存储了用户表的region信息
~~~     根据namespace、表名和rowkey信息。找到写入数据对应的region信息
~~~     找到这个region对应的regionServer,然后发送请求
~~~     把数据分别写到HLog(write ahead log)和memstore各一份
~~~     memstore达到阈值后把数据刷到磁盘,生成storeFile文件
~~~     删除HLog中的历史数据

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

posted on   yanqi_vip  阅读(20)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示