hadoop完全分布式环境搭建

1，设置Java环境

rpm -ivh jdk-8u73-linux-x64.rpm

添加环境变量到启动文件
vi /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_73
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tool.jar

测试java环境

[root@DEV ~]# more test.java 
public class test{
    public static void main(String args[]){
        System.out.println("A new jdk test...sqing!");
    }
}

javac test.java

[root@hadoop1 ~]# java test
A new jdk test...sqing!

看到这，表明java环境设置成功！

2，配置hosts

192.168.1.208 hadoop1
192.168.1.210 hadoop2

3，配置ssh无密登录

[root@hadoop1 ~]# ssh-keygen -t rsa -P ""
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): 
Created directory '/root/.ssh'.
Your identification has been saved in /root/.ssh/id_rsa.
Your public key has been saved in /root/.ssh/id_rsa.pub.
The key fingerprint is:
0d:23:95:a0:7a:ce:78:ef:5b:a8:ab:35:53:01:91:85 root@hadoop1
The key's randomart image is:
+--[ RSA 2048]----+
|    o=o...       |
|    Eo ..        |
|    . o o        |
|   .   o +       |
|  . . . S .      |
|   = . .         |
|  . B . .        |
|   o = .         |
|  ..oo+.         |
+-----------------+
[root@hadoop1 ~]# cat .ssh/id_rsa.pub >>.ssh/authorized_keys
[root@hadoop1 ~]# ssh localhost
The authenticity of host 'localhost (::1)' can't be established.
RSA key fingerprint is 19:09:80:d2:03:1a:d0:1d:00:79:33:ea:4e:71:e0:eb.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added 'localhost' (RSA) to the list of known hosts.
Last login: Wed Mar  9 19:28:12 2016 from 192.168.1.3

copy authorized_keys到其它机器上，便可以实现无密登录其它机器

[root@hadoop1 ~]# ssh 192.168.1.210
Last login: Wed Mar 9 19:43:20 2016 from 192.168.1.3
[root@hadoop2 ~]#

下面便是解压，移动，hadoop

配置文件1：hadoop-env.sh

该文件是hadoop运行基本环境的配置，需要修改的为java虚拟机的位置。

/usr/local/hadoop/etc/hadoop

配置文件2：yarn-env.sh

该文件是yarn框架运行环境的配置，同样需要修改java虚拟机的位置。

配置文件3：slaves

该文件里面保存所有slave节点的信息

配置文件4：core-site.xml

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/data/hadoop-${user.name}</value>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop1:9000</value>
</property>
</configuration>

这个是hadoop的核心配置文件，这里需要配置的就这两个属性，fs.default.name配置了hadoop的HDFS系统的命名，位置为主机的 9000端口；hadoop.tmp.dir配置了hadoop的tmp目录的根位置。这里使用了一个文件系统中没有的位置，所以要先用mkdir命令新建一下。

配置文件5：hdfs-site.xml

<configuration>
<property>
<name>dfs.http.address</name>
<value>hadoop1:50070</value>
</property>

<property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop1:50090</value>
</property>

<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

这个是hdfs的配置文件，dfs.http.address配置了hdfs的http的访问位置；dfs.replication配置了文件块的副本数，一般不大于从机的个数。

配置文件6：mapred-site.xml

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop1:9001</value>
</property>

<property>
<name>mapred.map.tasks</name>
<value>20</value>
</property>

<property>
<name>mapred.reduce.tasks</name>
<value>4</value>
</property>

<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

<property>
<name>mapreduce.jobhistory.address</name>
<value>hadoop1:10020</value>
</property>

<property><name>mapreduce.jobhistory.webapp.address</name>
<value>hadoop1:19888</value>
</property>
</configuration>

配置文件7：yarn-site.xml

<configuration>


<property>
<name>yarn.resourcemanager.address</name>
<value>hadoop1:8032</value>
</property>

<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>hadoop1:8030</value>
</property>

<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>hadoop1:8088</value>
</property>

<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>hadoop1:8031</value>
</property>

<property>
<name>yarn.resourcemanager.admin.address</name>
<value>hadoop1:8033</value>
</property>

<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>

<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>

将配置好的hadoop复制到其他节点

scp -r hadoop/ root@hadoop2:~/

格式化namenode：

./bin/hdfs namenode -format

若出现如图所示提示，则格式化成功

出现图示部分，则表示成功!

启动hdfs: ./sbin/start-dfs.sh

此时在Master上面运行的进程有：namenode secondarynamenode

Slave1和Slave2上面运行的进程有：datanode

启动yarn: ./sbin/start-yarn.sh

此时在Master上面运行的进程有：namenode secondarynamenode resourcemanager

Slave1和Slave2上面运行的进程有：datanode nodemanager

http://192.168.1.208:50070

http://192.168.1.208:8088

end!

posted @ 2016-03-09 14:32 知_行阅读(377) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

知_行

博学之，审问之，慎思之，明辨之，笃行之

hadoop完全分布式环境搭建

公告