08 2014 档案
摘要:HBase 从0.95开始引入了Snapshot,可以对table进行Snapshot,也可以Restore到Snapshot。Snapshot可以在线做,也可以离线做。Snapshot的实现不涉及到table实际数据的拷贝,仅仅拷贝一些元数据,比如组成table的region info,表的de...
阅读全文
摘要:HBase 可以根据当前集群的负载以region为单位进行rebalance。在HMaster中,后台会起一个线程定期检查是否需要进行rebalance,线程叫做BalancerChore。线程每隔hbase.balancer.period会定期执行 master.balance()函数,配置项默...
阅读全文
摘要:MVCC是实现高性能数据库的关键技术,主要为了读不影响写。几乎所有数据库系统都用这技术,比如Spanner,看这里。Percolator,看这里。当然还有mysql。本文说HBase的MVCC和0.98引入的新写线程模型。 HBase region server的存储模型类LSM,将随机写转换为顺...
阅读全文
摘要:本文分析RegionServer宕机后这个region server上的region是如何在其他region server上恢复的。region server宕机后发生了什么 HMaster有一个RegionServerTracker对象,监控zk上/hbase/rs目录下的结点,达到监控reg...
阅读全文
摘要:Google为了解决网页索引的增量处理,以及维护数据表和索引表的一致性问题,基于BigTable实现了一个支持分布式事务的存储系统。这里重点讨论这个系统的分布式事务实现,不讨论percolator中为了支持增量计算而实现的Notifications机制。 该系统基于BigTable,支持snaps...
阅读全文