HBase的数据存储原理
- 一个HRegionServer会负责管理很多个region
- 一个region包含很多个store
- 一个列族就划分成一个store
- 如果一个表中只有1个列族,那么这个表的每一个region中只有一个store
- 如果一个表中有N个列族,那么这个表的每一个region中有N个store
- 一个store里面只有一个memstore
- memstore是一块内存区域,写入的数据会先写入memstore进行缓冲,然后再把数据刷到磁盘
- 一个store里面有很多个StoreFile, 最后数据是以很多个HFile这种数据结构的文件保存在HDFS上
- StoreFile是HFile的抽象对象,如果说到StoreFile就等于HFile
- 每次memstore刷写数据到磁盘,就生成对应的一个新的HFile文件出来