1.部署hadoop

和普通的datanode一样。安装jdk，ssh

2.修改host

和普通的datanode一样。添加namenode的ip

3.修改namenode的配置文件conf/slaves

添加新增节点的ip或host

4.在新节点的机器上，启动服务

[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode 
[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start tasktracker

5.均衡block

[root@slave-004 hadoop]# ./bin/start-balancer.sh

这个会非常耗时
1）如果不balance，那么cluster会把新的数据都存放在新的node上，这样会降低mapred的工作效率
2）设置平衡阈值，默认是10%，值越低各节点越平衡，但消耗时间也更长
[root@slave-004 hadoop]# ./bin/start-balancer.sh -threshold 5
3）设置balance的带宽，默认只有1M/s

<property> 
<name>dfs.balance.bandwidthPerSec</name> 
<value>1048576</value> 
<description> 
Specifies the maximum amount of bandwidth that each datanode 
can utilize for the balancing purpose in term of 
the number of bytes per second. 
</description> 
</property>

注意：

1. 必须确保slave的firewall已关闭;
2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中，反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中

posted on 2012-04-18 01:11 ggjucheng 阅读(6742) 评论(0) 编辑收藏举报

刷新页面返回顶部

简单，可复制

公告

1.部署hadoop

2.修改host

3.修改namenode的配置文件conf/slaves

4.在新节点的机器上，启动服务

5.均衡block

注意：