摘要: 其实很多人都知道hadoop自带一个hadoop balancer的功能,作用于让各个datanode之间的数据平衡.比如说node-A有100GB数据,占用磁盘99%空间;而node-B只有10GB数据占用磁盘10%空间~那么当我们以hdfs身份运行hadoop balance的时候,hadoop将会平衡这两个node之间的数据.至于多少叫做平衡,hadoop的default是10%的threshold, 但是我们可以在命令里面指定一个门限~比如:sh $HADOOP_HOME/bin/start-balancer.sh –t 15%具体的用法可以参照: http://www.cnblogs 阅读全文
posted @ 2013-09-10 11:43 linehrr-freedom 阅读(1418) 评论(0) 推荐(0) 编辑