hadoop分布式安装

我是看的这个视频安装的。https://www.bilibili.com/video/BV1ES4y1R7Fk，我图省事儿找的这个视频对应的文档，结果发现文档有一个地方错了，为了记录发了一下，谢谢原作者

配置安装hadoop

一、需要的软件

1、虚拟机管理软件：VMware

2、系统：CentOS 7

3、ssh软件：Xshell 7

4、hadoop版本：2.7.7

5、Jdk版本：jdk8

二、安装配置Hadoop

注意：使用超级管理员root登录。

0、配置虚拟机

下载Centos7.6.iso文件

然后新建虚拟机

然后关机克隆出两个一样的虚拟机

1、配置静态网络，关闭防火墙（三个机器都要做，Ip地址要设置为静态的，ip地址都不一样）

（1）使用ping 命令检测网络是否连通

ping www.baidu.com 使用ctrl+c来停止命令

如果网络没有打开，打开网络：

（2）修改ip地址，设置为静态网络。

service network restart

cd /etc/sysconfig/network-scripts

#在network-scripts中，选择编辑ifcfg-ens33这个文件修改ip地址信息。

vim ifcfg-ens33DNS

服务器地址是当前windows的DNS服务器地址。

（3）输入i 进入insert编辑

（4）把BOOTPROTO="hdcp" 改为BOOTPROTO=”static”静态网络ip

（5）设置ONBOOT="yes"

点击vmware的【编辑】>【虚拟网络编辑器】>选择【VMnet8网络】>选择【NAT】按钮查看VMnet8

相关网络信息，包括子网ip、子网掩码、网关。

（6）添加master IP地址为：IPADDR="192.168.122.3"

（ip地址需要跟虚拟网络编辑器中的ip地址在同一个网段中，就是前三位要一样，后三位每个虚拟机的分别为3,4,5）

注意:s1和s2的ip地址也要修改，三个系统的ip地址前三位一样。最后一位不一样。

（7）添加子网掩码：NETMASK="255.255.255.0"

（8）添加网关：

GATEWAY="192.168.50.2"

（9）添加自己宿主机的DNS: DNS1="192.168.1.1"

IPADDR="192.168.122.3"    
NETMASK="255.255.255.0"   
GATEWAY="192.168.122.2"   
DNS1="192.168.1.1"

（10）保存退出：

esc + :wq

（11）重启网络：

service network restart

（12）测试网络有没有连通

ping www.baidu.com

2、关闭防火墙

#关闭防火墙
systemctl stop firewalld
#禁用防火墙
systemctl disable firewalld
#查看防火墙状态
systemctl status firewalld

3.配置主机名

#在第一台机器操作
hostnamectl set-hostname master
#在第二台机器操作
hostnamectl set-hostname s1
#在第三台机器操作
hostnamectl set-hostname s2

设置完毕后需重启虚拟机：reboot

4.编辑hosts文件

hosts 配置文件是用来把主机名字映射到IP地址的方法，这种方法比较简单

（1）编辑hosts文件：

vi /etc/hosts

（2）进入编辑模式 i

（3）在最后一行添加（你刚才配置的主机ip地址）

192.168.122.3 master
192.168.122.4 s1
192.168.122.5 s2

备注：这里是把三个Linux的ip地址保存到三个虚拟机去，相当于我们自己在手机里面存别人的电话号码

一样的道理，这样相互之间就知道对应ip地址的机器是哪一台。所以这个操作也是要在三台虚拟机都要

进行的。给ip地址起名字，几个机器需要互相连通，这样在连接几台机器的时候只需要使用机器名就

行，不需要使用ip地址。

（4）在s1和s2进行相同的操作。

（5）使用ping命令，看是否能够进行相互的连通。

在master里面连通s1和s2。

ping s1 
ping s2

5.文件传送xftp

6.配置SSH免密登录

在xshell中,Shift+insert键表示粘贴

把hadoop2.7.7压缩文件和jdk压缩文件传送到master中即可，s1和s2不需要传送。

（1）在各个机器（master、s1、s2）家目录执行，

ssh-keygen -b 1024 -t rsa

输入2次回车，输入

y/yes再继续回车

（2）ls -all :查看所有文件和文件夹

（3）退回到root根目录。进入 .ssh目录中

cd .ssh

（4）查看目录

输入：ls

　　如何能在master中对s1和s2进行免密登录？需要把master的公钥放到s1和s2的authorized_keys

文件里

（5）查看mster的公钥

cat id_rsa.pub

（6）在master的.ssh目录中执行

ssh-copy-id s1 
ssh-copy-id s2 
ssh-copy-id master

（7）在s1的.ssh目录中执行

ssh-copy-id s2

（8）在s2的.ssh目录中执行

ssh-copy-id s1

（9）配置权限

　　在master、s1和s2的.ssh目录中执行该命令

chmod 600 authorized_keys

（10）相互验证能否免密登录

ssh s1 
ssh s2 
#exit表示退出登录

7.设置时间同步

crontab -e 0 1 * * * /usr/sbin/ntpdate cn.pool.ntp.org

8.解压jdk包和Hadoop包并安装jdk

（1）解压压缩文件：解压hadoop文件和jdk文件，输入命令时可以用tab键补全

tar -zxvf hadoop-2.7.7.tar.gz 
tar -zxvf jdk-8u181-linux-x64.tar.gz

（2）安装jdk，设置环境变量

两个环境变量配置文件是父子关系，后者会继承前者的环境变量配置。

所有用户的环境变量（全局，父）

#设置环境变量 vim /etc/profile 
#在末尾追加环境变量 
#如果你自己解压到其他的位置，那么就根据你自己的位置去写参数。
export JAVA_HOME=/root/jdk1.8.0_181 
export PATH=$JAVA_HOME/bin:$PATH 
#解释：输入路径就是为了方便找到bin目录的java。
 #使环境变量生效 source /etc/profile 
#可以查看java的版本 [root@master ~]# java -version 
java version "1.8.0_181" 
Java(TM) SE Runtime Environment (build 1.8.0_181-b11) 
Java HotSpot(TM) 64-Bit Server VM (build 25.171-b11, mixed mode)

到此,master中的java配置已经结束了.

（3）在s1和s2中不用再去安装，直接传送就好了

[root@master ~]# scp -r jdk1.8.0_181 root@s1:~/ 
[root@master ~]# scp -r jdk1.8.0_181 root@s2:~/

(4)可以在s1和s2中查看传送过来的文件。

(5)配置s1和s2的环境变量，参考步骤（2）。

9.配置Hadoop(7个文件)

在master上面配置好了直接将文件夹复制到从机上。

（1）进入Hadoop的/etc目录下。

需要修改hadoop下的三个文件：yarn-env.sh、hadoop-env.sh、core-site.xml

cd hadoop-2.7.7/etc/hadoop

（2）修改hadoop-env.sh文件（注意，不是追加在末尾，是在中间的某个位置）

vim hadoop-env.sh 
#修改JAVA_HOME的路径 
export JAVA_HOME=/root/jdk1.8.0_181（我也是看的别人的，我下载的是181版本，这个是别人的截图）

保存退出。

（3）修改yarn-env.sh文件的JAVA_HOME。（注意，也是追加在末尾，是在中间的某个位置）

[root@master hadoop]# vim yarn-env.sh

#配置java_home

JAVA_HOME=/root/jdk1.8.0_181

保存退出。

（4）修改core-site.xml文件

vim core-site.xml

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/root/hadoopdata</value>
    </property>
</configuration>

mkdir hadoopdata解释说明：
fs.defaultFS中的FS适合两个以上的主机使用，单点的话最好使用.name
hdfs://master:9000:master为主机名,9000为端口号
hadoop.tmp.dir ：hadoop运行过程中产生的一些临时中间数据。
/home/zkpk/hadoopdata：存放临时数据的文件夹。

（6）配置hdfs-site.xml

　　　　1）编辑hdfs-site.xml文件

[root@master hadoop]# vim hdfs-site.xml

　　　　2）加入以下内容：

<configuration>
　　<property>
    　　<name>dfs.replication</name>
    　　<value>2</value>
　　</property>

</configuration>

补充说明:一个文件会复制两个副本分别在s1和s2下。

（7）编辑mapred-site.xml文件

由于上面修改的是mapred-site.xml.template，而不是mapred-site.xml，所以我们可以把

mapred-site.xml.template文件名修改为mapred-site.xml。

需要把mapred-site.xml.template文件的名字改为mapred-site.xml，

mv mapred-site.xml.template mapred-site.xmlvim mapred-site.xml

#粘贴以下内容

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

（8）编辑yarn-site.xml文件

vim yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

保存退出。

（9）编辑 slaves文件

vim slaves 
#填入两个从机名 和主机名
#视频原文档就是这里错了，应该是三个
master
s1
s2

（10）复制hadoop目录传到从机上

scp -r hadoop-2.7.7 s1:~/ 
scp -r hadoop-2.7.7 s2:~/

（5）在三台虚拟机中 /root下创建hadoopdata目录（这里由于配置文件时/root/hadoopdata，所以要在这个位置新建文件夹）

mkdir hadoopdata

（11）配置环境变量

系统环境配置在master、s1和s2相同，以master 为例。

进入根目录。

vim /etc/profile #将下面的代码追加/etc/profile末尾： 
export HADOOP_HOME=/root/hadoop-2.7.7 
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/

使文件生效

source /etc/profile

10.hadoop格式化

格式化只能进行一次，多次格式化会导致dataNode出不来，（如果没那个master也是没有dataNode）。

在master上面进行。

hdfs namenode -format

11.启动hadoop

在master里面

start-all.sh

或者分那两布

start-dfs.sh 
start-yarn.sh

jps查看是否成功

[root@master hadoop]# jps

12.web ui查看hadoop集群

http://master:50070

http://master:8088

13.原文档

hi，这是我用百度网盘分享的内容~复制这段内容打开「百度网盘」APP即可获取
链接:https://pan.baidu.com/s/1sZa4mwec3YGpFiBzmzu9ig
提取码:637p

posted on 2021-12-27 17:15 纯正肉包阅读(209) 评论(0) 编辑收藏举报