|NO.Z.00022|——————————|BigDataEnd|——|Hadoop&HBase.V06|——|HBase.v06|HBase原理|读写Flush阻塞|合并机制.v02|

一、HBase的flush(刷写)及compact(合并)机制
### --- Flush机制
~~~     当memstore的大小超过这个值的时候,会flush到磁盘,默认为128M

<property>
    <name>hbase.hregion.memstore.flush.size</name>
    <value>134217728</value>
</property>
<property>
    <name>hbase.regionserver.optionalcacheflushinterval</name>
    <value>3600000</value>
</property>2、当memstore中的数据时间超过1小时,会flush到磁盘

<property>
    <name>hbase.regionserver.optionalcacheflushinterval</name>
    <value>3600000</value>
</property>
### --- HregionServer的全局memstore的大小,超过该大小会触发flush到磁盘的操作,默认是堆大小的40%
    
    <property>
    <name>hbase.regionserver.global.memstore.size</name>
    <value>0.4</value>
</property>
### --- 手动flush

flush tableName
二、阻塞机制
### --- 阻塞机制

~~~     以上介绍的是Store中memstore数据刷写磁盘的标准,
~~~     但是Hbase中是周期性的检查是否满足以上标准满足则进行刷写,
~~~     但是如果在下次检查到来之前,数据疯狂写入Memstore中,会出现什么问题呢?
~~~     会触发阻塞机制,此时无法写入数据到Memstore,数据无法写入Hbase集群。
### --- memstore中数据达到512MB
~~~     计算公式:hbase.hregion.memstore.flush.size*hbase.hregion.memstore..block.multiplierhbase.hregion.memstore.flush.size刷写的阀值,
~~~     默认是 134217728,
~~~     即128MB。
### --- hbase.hregion.memstore.block.multiplier是一个倍数,
~~~     默认 是4。
~~~     RegionServer全部memstore达到规定值hbase.regionserver.global.memstore.size.lower.limit是0.95,
~~~     hbase.regionserver.global.memstore.size是0.4,
~~~     堆内存总共是 16G,
~~~     触发刷写的阈值是:6.08GB
~~~     触发阻塞的阈值是:6.4GB
### --- Compact合并机制

~~~     在hbase中主要存在两种类型的compac合并
~~~     minor compact 小合并
~~~     在将Store中多个HFile(StoreFile)合并为一个HFile
~~~     这个过程中,删除和更新的数据仅仅只是做了标记,并没有物理移除,这种合并的触发频率很高。
### --- minor compact文件选择标准由以下几个参数共同决定:

<!--待合并文件数据必须大于等于下面这个值-->
<property>
    <name>hbase.hstore.compaction.min</name>
    <value>3</value>
</property>

<!--待合并文件数据必须小于等于下面这个值-->
<property>
    <name>hbase.hstore.compaction.max</name>
    <value>10</value>
</property>

<!--默认值为128m,表示文件大小小于该值的store file 一定会加入到minor compaction的store file中-->
<property>
    <name>hbase.hstore.compaction.min.size</name>
    <value>134217728</value>
</property>

<!--默认值为LONG.MAX_VALUE,表示文件大小大于该值的store file 一定会被minor compaction排除-->
<property>
    <name>hbase.hstore.compaction.max.size</name>
    <value>9223372036854775807</value>
</property>
### --- 触发条件

~~~     memstore flush
~~~     在进行memstore flush前后都会进行判断是否触发compact
~~~     定期检查线程
~~~     周期性检查是否需要进行compaction操作,由参数:
~~~     hbase.server.thread.wakefrequency决定,默认值是10000 millseconds
~~~     major compact 大合并
~~~     合并Store中所有的HFile为一个HFile
~~~     这个过程有删除标记的数据会被真正移除,同时超过单元格maxVersion的版本记录也会被删除。
~~~     合并频率比较低,默认7天执行一次,并且性能消耗非常大,建议生产关闭(设置为0),
~~~     在应用空闲时间手动触发。一般可以是手动控制进行合并,防止出现在业务高峰期。
### --- major compaction触发时间条件

<!--默认值为7天进行一次大合并,-->
<property>
    <name>hbase.hregion.majorcompaction</name>
    <value>604800000</value>
</property>
### --- 手动触发
~~~     # 使用major_compact命令

major_compact tableName

 
 
 
 
 
 
 
 
 

Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
                                                                                                                                                   ——W.S.Landor

 

posted on   yanqi_vip  阅读(20)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

点击右上角即可分享
微信分享提示