HBase物理存储

1.Table中的所有行都是按照RowKey的字典序排列.

2.Table在行的方向上分割为多个HRegion

  

3.Region按照大小分割.每个表刚开始只有一个Region,随着数据不断的插入表中,Region不断增大,当增大到一个阀值的时候Hregion就会等分为两个HRegion.当Table中的行不断增多,就会有越来越多的Region.

4.HRegion是HBase中分布式存储和负载均衡的最小单元.最小单元是指不同的HRegion 可以分布在不同HRegionServer上,但是同一个HRegion不能分布在不同的server上.

5.Hregion是分布式存储的最小单元,但却不是存储的最小单元.事实上,Hbase由一个或多个Store组成,每个Store保存一个ColumnFamily,每个Store又由一个memStore和0到多个StoreFile组成.

如图:StoreFile将以HFile的形式保存在HDFS|上

 

posted @ 2015-04-16 08:40  上海联通  阅读(1041)  评论(0编辑  收藏  举报