hbase region均衡机制
region分裂之后,服务器有可能出现宕机,新的服务器可能加入到集群中,因此,在某种程度中,数据将不会很合理地分布在你所有的region server上,为了帮助集群拥有合理的分布数据,每5分钟(默认的配置调度时间)Hbase Master会启动一个负载均衡算法来保证所有的RegionServer管理和服务着近乎相同的数据的region。
Hbase有几种不同的负载均衡算法,simpleLoadBalancer 和 stochasticLoadBalancer(默认)。
注意的是:
当一个region被负载均衡器从一个服务器移动到另一个新的服务器,在几毫秒内该region处于不可用的情况,同时会丢弃本地的数据,但是只有到下一次做大合并的操作的时候才能真正的丢弃。