|NO.Z.00022|——————————|BigDataEnd|——|Hadoop&HBase.V06|——|HBase.v06|HBase原理|读写Flush阻塞|合并机制.v02|
一、HBase的flush(刷写)及compact(合并)机制
### --- Flush机制
~~~ 当memstore的大小超过这个值的时候,会flush到磁盘,默认为128M
<property>
<name>hbase.hregion.memstore.flush.size</name>
<value>134217728</value>
</property>
<property>
<name>hbase.regionserver.optionalcacheflushinterval</name>
<value>3600000</value>
</property>2、当memstore中的数据时间超过1小时,会flush到磁盘
<property>
<name>hbase.regionserver.optionalcacheflushinterval</name>
<value>3600000</value>
</property>
### --- HregionServer的全局memstore的大小,超过该大小会触发flush到磁盘的操作,默认是堆大小的40%
<property>
<name>hbase.regionserver.global.memstore.size</name>
<value>0.4</value>
</property>
### --- 手动flush
flush tableName
二、阻塞机制
### --- 阻塞机制
~~~ 以上介绍的是Store中memstore数据刷写磁盘的标准,
~~~ 但是Hbase中是周期性的检查是否满足以上标准满足则进行刷写,
~~~ 但是如果在下次检查到来之前,数据疯狂写入Memstore中,会出现什么问题呢?
~~~ 会触发阻塞机制,此时无法写入数据到Memstore,数据无法写入Hbase集群。
### --- memstore中数据达到512MB
~~~ 计算公式:hbase.hregion.memstore.flush.size*hbase.hregion.memstore..block.multiplierhbase.hregion.memstore.flush.size刷写的阀值,
~~~ 默认是 134217728,
~~~ 即128MB。
### --- hbase.hregion.memstore.block.multiplier是一个倍数,
~~~ 默认 是4。
~~~ RegionServer全部memstore达到规定值hbase.regionserver.global.memstore.size.lower.limit是0.95,
~~~ hbase.regionserver.global.memstore.size是0.4,
~~~ 堆内存总共是 16G,
~~~ 触发刷写的阈值是:6.08GB
~~~ 触发阻塞的阈值是:6.4GB
### --- Compact合并机制
~~~ 在hbase中主要存在两种类型的compac合并
~~~ minor compact 小合并
~~~ 在将Store中多个HFile(StoreFile)合并为一个HFile
~~~ 这个过程中,删除和更新的数据仅仅只是做了标记,并没有物理移除,这种合并的触发频率很高。
### --- minor compact文件选择标准由以下几个参数共同决定:
<!--待合并文件数据必须大于等于下面这个值-->
<property>
<name>hbase.hstore.compaction.min</name>
<value>3</value>
</property>
<!--待合并文件数据必须小于等于下面这个值-->
<property>
<name>hbase.hstore.compaction.max</name>
<value>10</value>
</property>
<!--默认值为128m,表示文件大小小于该值的store file 一定会加入到minor compaction的store file中-->
<property>
<name>hbase.hstore.compaction.min.size</name>
<value>134217728</value>
</property>
<!--默认值为LONG.MAX_VALUE,表示文件大小大于该值的store file 一定会被minor compaction排除-->
<property>
<name>hbase.hstore.compaction.max.size</name>
<value>9223372036854775807</value>
</property>
### --- 触发条件
~~~ memstore flush
~~~ 在进行memstore flush前后都会进行判断是否触发compact
~~~ 定期检查线程
~~~ 周期性检查是否需要进行compaction操作,由参数:
~~~ hbase.server.thread.wakefrequency决定,默认值是10000 millseconds
~~~ major compact 大合并
~~~ 合并Store中所有的HFile为一个HFile
~~~ 这个过程有删除标记的数据会被真正移除,同时超过单元格maxVersion的版本记录也会被删除。
~~~ 合并频率比较低,默认7天执行一次,并且性能消耗非常大,建议生产关闭(设置为0),
~~~ 在应用空闲时间手动触发。一般可以是手动控制进行合并,防止出现在业务高峰期。
### --- major compaction触发时间条件
<!--默认值为7天进行一次大合并,-->
<property>
<name>hbase.hregion.majorcompaction</name>
<value>604800000</value>
</property>
### --- 手动触发
~~~ # 使用major_compact命令
major_compact tableName
Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart
——W.S.Landor
分类:
bdv010-hbase
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」