hbase的相关组件
hbase的列族
hbase的列族存储的是相同IO属性的数据,每个文件对应hdfs上的一个文件
在hbase建表时需要指定有多少个列族
对列族进行管理的是HRegion
hbase的region
假设有个db1表,它有10000行数据,2500行存储在一个region里,
region编号 | startKey | endKey |
1 | 2500 | |
2 | 2500 | 5000 |
3 | 5000 | 7500 |
4 | 7500 |
这里一张表的10000行数据分成了4个文件(一个文件对应一个region)
第一个region没有startKey,因为它要往前存
最后一个region没有endKey,因为它要往后存
对Region进行管理的是HRegionServer
hbase的zookeeper
这里的zookeeper在hbase里起到了有两个作用:
1.对元数据进行管理
2.对hmaster的状态进行了管理
如果把zookeeper的元数据清除了,那hbase里面表的数据就没有了。
hbase的hmaster
hbase是主从架构,你可以启动800个hmaster,但是zookeeper只会保证只有一个active,剩下的全是standby
standby和active要进行关联,通过zookeeper来监控它是不是active