Hadoop完全分布式环境部署
- Hadoop的集群规划
- 前置安装
- JDK安装
- Hadoop集群部署
1. Hadoop的集群规划
前面我们都了解了Hadoop和Yarn的运行原理和架构,
Hadoop包含:NameNode,DataNode,SeconderNameNode节点
Yarn包含:ResourceManage NodeManger节点
集群规划:
- 分别设置他们的主机名(vi /etc/sysconfig/network),
- 设置后重启LinuX
- 分别根据节点的方式配置ip地址(子节点跟主节点在同一节点上)
- vi /etc/sysconfig/network-scripts/ifcfg-eth0
- 设置主节点和子节点之间的ip和主机名的映射关系
- vi /etc/hosts 主节点排第一,依次往下
- 关闭子节点防火墙 (chkconfig iptables off)
2.前置安装
- ssh免密登陆
- 每台机器执行:ssh-keygen -t rsa 命令
- 在主节点执行 :ssh-copy-id -i ~/.ssh/id-rsa.pub 节点名(主机名)
- 验证: 在主节点使用:ssh 子节点名 (如果不需要密码则配置成功)
3.JDK安装
- 设置子节点的目录结构
- 在主节点执行:拷贝主节点jdk压缩包的路径到各个子节点中(scp -r jdk路径 用户名@主机名:~/目录地址)
- 在各个子节点配置环境变量(vi /etc/profile)
4.Hadoop集群的部署
- 在主节点修改slaves文件(vi /etc/slaves)
- 把各个子节点相关的配置文件,环境变量修改下
- 在主节点格式化Hadoop(hadoop namenode -format)
- 在主节点启动HDFS
- 在主节点启动YARN
- 查看各个节点进程:sbin目录下执行jps
主节点:
- Jps
- SecondaryNameNode
- NodeManager
- NameNode
- ResourceManager
- DataNode
子节点:
- Jps
- DataNode
- NodeManager
5.验证是否成功:
进到hadoop中的share/hadoop/mapreduce 执行命令:
出现:Estimated value of Pi is 4.000000000 表示成功
常见错误及解决办法: