什么是HBase(二) 关于HFile分割

关于HFile的分割,是首先要从HFile的合并说起,上回书讲到memstore会不定期刷HFile,然后这些HFile将会被不定过期的被监控程序进行小合并+大合并(所有的文件,不分column family的合并);但是当HFile大到一定程度之后,将会进行分割,避免大文件太大,影响查询速度。
 
基本的流程:
1. 首先是region server通知zookeeper要把待分裂的region进行加锁(设置为spliting状态),不再接受访问;
2. zookeeper将会通知master(master watch了zookeeper这个节点信息);
3. hdfs将会在该region所属的文件夹下面创建.split文件夹;
4. 关闭region(此时在zookeeper中已经加锁,可以放心关闭);
5. 在.split文件夹下面创建两个分割文件对应的文件夹,然后对HFile文件进行分割,然后把相关的文件拷贝到对应的文件夹中;
6. hfds正式为分割的region文件创建标准的region文件夹,然后把.split下面的文件结构以及文件拷贝到region文件夹中;
7. region server将会通过PUT操作来在.META.文件中更新原region的信息(增加了split信息);
8. region server打开新的region;
9. region server将会通过PUT操作来在.META.文件中添加新的region的引用;
10. 更新zookeeper的信息,设置region的状态为split;
 
参考:
 

posted on 2018-04-18 21:39  下士闻道  阅读(287)  评论(0编辑  收藏  举报

导航