hbase的存储体系

一、了解hbase的存储体系。

hbase的存储体系核心的有Split机制,Flush机制和Compact机制。

 

1、split机制

每一个hbase的table表在刚刚开始的时候,只有一个region,随着数据的不断插入到表中,region开始增大,当增大到一定的阀值以后,region就会等分两个新的region。

当table表中的行数越多,就会有越来越多的region。

region是hbase中分布式存储和负载均衡的最小单元,相当于HDFS中的block。

2、Flush机制

HStore存储是HBase存储的核心,其中由两部分组成,MemStoreStoreFilesMemStoreSorted Memory Buffer

用户写入的数据首先会写入MemStore,就返回了,所以写性能很高。当MemStore满了以后会Flush成一个StoreFile

3、Compact机制

StoreFile文件数量增长到一定阈值,会触发Compact合并操作,将多个StoreFiles合并成一个StoreFile,合并过程中会对Cell进行版本合并和数据删除。

 

posted @ 2016-07-18 15:06  木子小僧  阅读(271)  评论(0编辑  收藏  举报