1.先建立一台虚拟机,分配内存2G,硬盘20G,网络为nat 模式,设置一个静态的ip 地址: 例如设定3台机器的ip 为 192.168.63.167(master) 192.16863.168(slave1) 192.168.63.169 (slave2)
2.修改第一台主机的用户名
3.复制master文件两次,重命名为slave1和slave2,打开虚拟机文件,然后按照同样的方法设置两个节点的ip和主机名
4.建立主机名和ip的映射
5.查看是否能ping通,关闭防火墙和selinux 配置
6.配置ssh免密码登录
在root用户下输入ssh-keygen -t rsa 一路回车
秘钥生成后在~/.ssh/目录下,有两个文件id_rsa(私钥)和id_rsa.pub(公钥),将公钥复制到authorized_keys并赋予authorized_keys600权限
同理在slave1和slave2节点上进行相同的操作,然后将公钥复制到master节点上的authoized_keys
检查是否免密登录(第一次登录会有提示)
7..安装JDK(省去)
三个节点安装java并配置java环境变量
8.安装MySQL(master 节点 省去)
9.安装SecureCRT或者xshell 客户端工具 ,然后分别链接上 3台服务器
12.搭建集群
12.1 集群结构
三个结点:一个主节点master两个从节点 内存2GB 磁盘20GB
12.2 新建hadoop用户及其用户组
用adduser新建用户并设置密码
将新建的hadoop用户添加到hadoop用户组
前面hadoop指的是用户组名,后一个指的是用户名
赋予hadoop用户root权限
12.3 安装hadoop并配置环境变量
由于hadoop集群需要在每一个节点上进行相同的配置,因此先在master节点上配置,然后再复制到其他节点上即可。
将hadoop包放在/usr/目录下并解压
配置环境变量
在/etc/profile文件中添加如下命令
12.4 搭建集群的准备工作
在master节点上创建以下文件夹
/usr/hadoop-2.6.5/dfs/name
/usr/hadoop-2.6.5/dfs/data
/usr/hadoop-2.6.5/temp
12.5 配置hadoop文件
接下来配置/usr/hadoop-2.6.5/etc//hadoop/目录下的七个文件
slaves core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml hadoop-env.sh yarn-env.sh
配置hadoop-env.sh
配置yarn-env.sh
配置slaves文件,删除localhost
配置core-site.xml
配置hdfs-site.xml
配置mapred-site.xml
配置yarn-site.xml
将配置好的hadoop文件复制到其他节点上
12.6 运行hadoop
格式化Namenode
source /etc/profile
13. 启动集群
[root@master sbin]# ./start-all.sh