Hadoop及Hbase部署

 


一 环境准备

 

1.1 相关环境

  • 系统:CentOS 7

#CentOS 6.x系列也可参考,转换相关命令即可。

  • hadoop包:hadoop-2.7.0.tar.gz

#下载官方地址:http://www.apache.org/dyn/closer.cgi/hadoop/common/

  • hbase包:hbase-1.0.3-bin.tar.gz

#下载官方地址:http://www.apache.org/dyn/closer.cgi/hbase

  • java环境:jdk-8u111-linux-x64.tar.gz

#下载官方地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

  • 其他:zookeeper-3.4.9.tar.gz

#下载官方地址:http://www.apache.org/dyn/closer.cgi/zookeeper/

 

 

1.2 网络环境

主机名
IP
master
172.24.8.12
slave01
172.24.8.13
slave02
172.24.8.14

二 基础环境配置

 

2.1 配置相关主机名

  1 [root@localhost ~]# hostnamectl set-hostname master
  2 [root@localhost ~]# hostnamectl set-hostname slave01
  3 [root@localhost ~]# hostnamectl set-hostname slave02
 

提示:三台主机都需要配置。

复制代码
  1 [root@localhost ~]# vi /etc/hosts
  2 ……
  3 172.24.8.12 master
  4 172.24.8.13 slave01
  5 172.24.8.14 slave02
  6 [root@localhost ~]# scp /etc/hosts root@slave01:/etc/hosts
  7 [root@localhost ~]# scp /etc/hosts root@slave02:/etc/hosts
复制代码
 

提示:直接将hosts文件复制到slave01和slave02。

 

2.2 防火墙及SELinux

复制代码
  1 [root@master ~]# systemctl stop firewalld.service #关闭防火墙
  2 [root@master ~]# systemctl disable firewalld.service #禁止开机启动防火墙
  3 [root@master ~]# vi /etc/selinux/config
  4 ……
  5 SELINUX=disabled
  6 [root@master ~]# setenforce 0
复制代码
 

提示:三台主机都需要配置,配置相关的端口放行和SELinux上下文,也可不关闭。

 

2.3 时间同步

  1 [root@master ~]# yum -y install ntpdate
  2 [root@master ~]# ntpdate cn.ntp.org.cn
 

提示:三台主机都需要配置。

三 jdk安装配置

注意:将所需安装包上传至/usr/即可。

 

3.1 jdk环境安装

  1 [root@master ~]# cd /usr/
  2 [root@master usr]# tar -zxvf jdk-8u111-linux-x64.tar.gz
 

提示:三台都需要配置。

 

3.2 jdk系统变量增加

复制代码
  1 [root@master ~]# vi .bash_profile
  2 ……
  3 PATH=$PATH:$HOME/bin:$JAVA_HOME/bin
  4 export PATH
  5 export JAVA_HOME=/usr/jdk1.8.0_111
  6 [root@master ~]# scp /root/.bash_profile root@slave01:/root/.bash_profile
  7 [root@master ~]# scp /root/.bash_profile root@slave02:/root/.bash_profile
  8 [root@master ~]# source /root/.bash_profile		#重新加载环境变量
复制代码
 

提示:

1 直接将变量配置复制到slave01和slave02;
2 也可在/etc/profile添加变量。
  1 [root@master ~]# java -version					#测试
  2 [root@slave01 ~]# java -version					#测试
  3 [root@slave02 ~]# java -version					#测试
 

四 SSH无密钥访问

 

4.1 master-slave01之间无密钥登录

  1 [root@master ~]# ssh-keygen -t rsa
  2 [root@slave01 ~]# ssh-keygen -t rsa
  3 [root@slave02 ~]# ssh-keygen -t rsa
 

提示:三台都需要生成key密钥。

复制代码
  1 [root@slave01 ~]# scp /root/.ssh/id_rsa.pub root@master:/root/.ssh/slave01.id_rsa.pub
  2 #将slave01主机的公钥复制给master,并命名为slave01.id_rsa.pub。
  3 [root@master ~]# cat /root/.ssh/id_rsa.pub >>/root/.ssh/authorized_keys
  4 [root@master ~]# cat /root/.ssh/slave01.id_rsa.pub >>/root/.ssh/authorized_keys
  5 [root@master ~]# scp /root/.ssh/authorized_keys slave01:/root/.ssh/
  6 #将master中关于master的公钥和slave01的公钥同时写入authorized_keys文件,并将此文件传送至slave01。
复制代码
 
提示:以上实现master<---->slave01双向无密钥登录。
4.2 master-slave02之间无密钥登录
复制代码
  1 [root@slave02 ~]# scp /root/.ssh/id_rsa.pub root@master:/root/.ssh/slave02.id_rsa.pub
  2 #将slave02主机的公钥复制给master,并命名为slave02.id_rsa.pub。
  3 [root@master ~]# cat /root/.ssh/id_rsa.pub >/root/.ssh/authorized_keys
  4 注意:此处为防止slave之间互相登录,采用覆盖方式写入。
  5 [root@master ~]# cat /root/.ssh/slave02.id_rsa.pub >>/root/.ssh/authorized_keys
  6 [root@master ~]# scp /root/.ssh/authorized_keys slave02:/root/.ssh/
  7 #将master中关于master的公钥和slave01的公钥同时写入authorized_keys文件,并将此文件传送至slave01。
  8 #以上实现master<---->slave01双向无密钥登录。
  9 [root@master .ssh]# cat slave01.id_rsa.pub >>authorized_keys
 10 #为实现master和slave01、slave02双向无密钥登录,将slave01的公钥重新写入。
 11 [root@master ~]# cat /root/.ssh/authorized_keys		#存在master和slave01、slave02的三组公钥
 12 [root@slave01 ~]# cat /root/.ssh/authorized_keys	#存在master和slave01的公钥
 13 [root@slave02 ~]# cat /root/.ssh/authorized_keys	#存在master和slave02的公钥
复制代码
 

五 安装hadoop及配置

 

5.1 解压hadoop

  1 [root@master ~]# cd /usr/
  2 [root@master usr]# tar -zxvf hadoop-2.7.0.tar.gz
 

 

5.2 创建相应目录

复制代码
  1 [root@master usr]# mkdir /usr/hadoop-2.7.0/tmp			#存放集群临时信息
  2 [root@master usr]# mkdir /usr/hadoop-2.7.0/logs			#存放集群相关日志
  3 [root@master usr]# mkdir /usr/hadoop-2.7.0/hdf			#存放集群信息
  4 [root@master usr]# mkdir /usr/hadoop-2.7.0/hdf/data		#存储数据节点信息
  5 [root@master usr]# mkdir /usr/hadoop-2.7.0/hdf/name		#存储Name节点信息
复制代码
 

 

5.3 master修改相关配置

5.3.1 修改slaves

  1 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/slaves
  2 slave01
  3 slave02
  4 #删除localhost,添加相应的主机名。
 

5.3.2 修改core-site.xml

复制代码
  1 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/core-site.xml
  2 ……
  3 <configuration>
  4         <property>
  5                 <name>fs.default.name</name>
  6                 <value>hdfs://master:9000</value>
  7         </property>
  8         <property>
  9                 <name>hadoop.tmp.dir</name>
 10                 <value>file:/usr/hadoop-2.7.0/tmp</value>
 11                 <description>
 12                         Abase for other temporary directories.
 13                 </description>
 14         </property>
 15         <property>
 16                 <name>hadoop.proxyuser.root.hosts</name>
 17                 <value>master</value>
 18         </property>
 19         <property>
 20                 <name>hadoop.proxyuser.root.groups</name>
 21                 <value>*</value>
 22         </property>
 23 </configuration>
复制代码
 

5.3.3 修改hdfs-site.xml

复制代码
  1 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/hdfs-site.xml
  2 ……
  3 <configuration>
  4         <property>
  5                 <name>dfs.datanode.data.dir</name>
  6                 <value>/usr/hadoop-2.7.0/hdf/data</value>
  7                 <final>true</final>
  8         </property>
  9         <property>
 10                 <name>dfs.namenode.name.dir</name>
 11                 <value>/usr/hadoop-2.7.0/hdf/name</value>
 12                 <final>true</final>
 13         </property>
 14 </configuration>
复制代码
 

5.3.4 修改mapred-site.xml

复制代码
  1 [root@master ~]# cp /usr/hadoop-2.7.0/etc/hadoop/mapred-site.xml.template /usr/hadoop-2.7.0/etc/hadoop/mapred-site.xml
  2 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/mapred-site.xml
  3 ……
  4 <configuration>
  5         <property>
  6                 <name>mapreduce.framework.name</name>
  7                 <value>yarn</value>
  8         </property>
  9         <property>
 10                 <name>mapreduce.jobhistory.address</name>
 11                 <value>master:10020</value>
 12         </property>
 13         <property>
 14                 <name>mapreduce.jobhistory.webapp.address</name>
 15                 <value>master:19888</value>
 16         </property>
 17 </configuration>
复制代码
 

5.3.5 修改yarn-site.xml

复制代码
  1 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/yarn-site.xml
  2 <configuration>
  3 ……
  4 <property>
  5         <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
  6         <value>org.apache.mapred.ShuffleHandler</value>
  7 </property>
  8 <property>
  9         <name>yarn.resourcemanager.address</name>
 10         <value>master:8032</value>
 11 </property>
 12 <property>
 13         <name>yarn.resourcemanager.scheduler.address</name>
 14         <value>master:8030</value>
 15 </property>
 16 <property>
 17         <name>yarn.resourcemanager.resource-tracker.address</name>
 18         <value>master:8031</value>
 19 </property>
 20 <property>
 21         <name>yarn.resourcemanager.admin.address</name>
 22         <value>master:8033</value>
 23 </property>
 24 <property>
 25         <name>yarn.resourcemanager.webapp.address</name>
 26         <value>master:8088</value>
 27 </property>
 28 </configuration>
复制代码
 

 

5.4 slave节点安装hadoop

  1 [root@master ~]# scp -r /usr/hadoop-2.7.0 root@slave01:/usr/
  2 [root@master ~]# scp -r /usr/hadoop-2.7.0 root@slave02:/usr/
 

提示:直接将master的hadoop目录复制到slave01和slave02。

六 系统变量及环境修改

 

6.1 hadoop环境变量

  1 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/hadoop-env.sh
  2 export JAVA_HOME=/usr/jdk1.8.0_111
  3 [root@master ~]# vi /usr/hadoop-2.7.0/etc/hadoop/yarn-env.sh
  4 export JAVA_HOME=/usr/jdk1.8.0_111
 

 

6.2 系统环境变量

复制代码
  1 [root@master ~]# vi /root/.bash_profile
  2 ……
  3 PATH=$PATH:$HOME/bin:$JAVA_HOME/bin
  4 export PATH
  5 export JAVA_HOME=/usr/jdk1.8.0_111
  6 export HADOOP_HOME=/usr/hadoop-2.7.0
  7 export HADOOP_LOG_DIR=/usr/hadoop-2.7.0/logs
  8 export YARN_LOG_DIR=$HADOOP_LOG_DIR
  9 [root@master ~]# scp /root/.bash_profile root@slave01:/root/
 10 [root@master ~]# scp /root/.bash_profile root@slave02:/root/
 11 [root@master ~]# source /root/.bash_profile
 12 [root@slave01 ~]# source /root/.bash_profile
 13 [root@slave02 ~]# source /root/.bash_profile
复制代码
 
提示:三台主机都需要配置,直接将master的profile文件复制到slave01和slave02。

七 格式化namenode并启动

复制代码
  1 [root@master ~]# cd /usr/hadoop-2.7.0/bin/
  2 [root@master bin]# ./hadoop namenode -format		#或者./hdfs namenode -format
  3 提示:其他主机不需要格式化。
  4 [root@master ~]# cd /usr/hadoop-2.7.0/sbin
  5 [root@master sbin]# ./start-all.sh				#启动
复制代码
 

提示:其他节点不需要启动,主节点启动时,会启动其他节点,查看其他节点进程,slave也可以单独启动datanode和nodemanger进程即可,如下——

  1 [root@slave01 ~]# cd /usr/hadoop-2.7.0/sbin
  2 [root@slave01 ~]# hadoop-daemon.sh start datanode
  3 [root@slave01 ~]# yarn-daemon.sh start nodemanager
 

八 检测hadoop

 

8.1 确认验证

浏览器输入http://172.24.8.12:50070

http://172.24.8.12:8088/cluster

01

 
02

8.2 java检测

复制代码
  1 [root@master ~]# /usr/jdk1.8.0_111/bin/jps
  2 21346 NameNode
  3 21703 ResourceManager
  4 21544 SecondaryNameNode
  5 21977 Jps
  6 [root@slave01 ~]# jps
  7 16038 NodeManager
  8 15928 DataNode
  9 16200 Jps
 10 15533 SecondaryNameNode
 11 [root@slave02 ~]# jps
 12 15507 SecondaryNameNode
 13 16163 Jps
 14 16013 NodeManager
 15 15903 DataNode
复制代码
 

九 安装Zookeeper

 

9.1 安装并配置zookeeper

  1 [root@master ~]# cd /usr/
  2 [root@master usr]# tar -zxvf zookeeper-3.4.9.tar.gz		#解压zookeeper
  3 [root@master usr]# mkdir /usr/zookeeper-3.4.9/data		#创建zookeeper数据保存目录
  4 [root@master usr]# mkdir /usr/zookeeper-3.4.9/logs		#创建zookeeper日志保存目录
 

 

9.2 修改zookeeper相关配置项

复制代码
  1 [root@master ~]# cp /usr/zookeeper-3.4.9/conf/zoo_sample.cfg /usr/zookeeper-3.4.9/conf/zoo.cfg
  2 #从模板复制zoo配置文件
  3 [root@master ~]# vi /usr/zookeeper-3.4.9/conf/zoo.cfg
  4 tickTime=2000
  5 initLimit=10
  6 syncLimit=5
  7 dataDir=/usr/zookeeper-3.4.9/data
  8 dataLogDir=/usr/zookeeper-3.4.9/logs
  9 clientPort=2181
 10 server.1=master:2888:3888
 11 server.2=slave01:2888:3888
 12 server.3=slave02:2888:3888
复制代码
 

 

9.3 创建myid

  1 [root@master ~]# vi /usr/zookeeper-3.4.9/data/myid
  2 1
 

注意:此处创建的文件myid内容为zoo.cfg配置中server.n中的n。即master为1,slave01为2,slave02为3。

 

9.4 修改环境变量

复制代码
  1 [root@master ~]# vi /root/.bash_profile				#修改环境变量
  2 PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin	#增加zookeeper变量路径
  3 export PATH
  4 export JAVA_HOME=/usr/jdk1.8.0_111
  5 export HADOOP_HOME=/usr/hadoop-2.7.0
  6 export HADOOP_LOG_DIR=/usr/hadoop-2.7.0/logs
  7 export YARN_LOG_DIR=$HADOOP_LOG_DIR
  8 export ZOOKEEPER_HOME=/usr/zookeeper-3.4.9/		#增加zookeeper路径
  9 [root@master ~]# source /root/.bash_profile
复制代码
 

 

9.5 Slave节点的zookeeper部署

  1 [root@master ~]# scp -r /usr/zookeeper-3.4.9/ root@slave01:/usr/
  2 [root@master ~]# scp -r /usr/zookeeper-3.4.9/ root@slave02:/usr/
  3 [root@master ~]# scp /root/.bash_profile root@slave01:/root/
  4 [root@master ~]# scp /root/.bash_profile root@slave02:/root/
 

提示:三台主机都需要配置,依次将zookeeper和环境变量文件profile复制到slave01和slave02。

 

9.6 Slave主机修改myid

  1 [root@slave01 ~]# vi /usr/zookeeper-3.4.9/data/myid
  2 2
  3 [root@slave02 ~]# vi /usr/zookeeper-3.4.9/data/myid
  4 3
 

 

9.7 启动zookeeper

复制代码
  1 [root@master ~]# cd /usr/zookeeper-3.4.9/bin/
  2 [root@master bin]# ./zkServer.sh start
  3 [root@slave01 ~]# cd /usr/zookeeper-3.4.9/bin/
  4 [root@slave01 bin]# ./zkServer.sh start
  5 [root@slave02 ~]# cd /usr/zookeeper-3.4.9/bin/
  6 [root@slave02 bin]# ./zkServer.sh start
复制代码
 

提示:三台主机都需要启动,命令方式一样。

十 安装及配置hbase

 

10.1 安装hbase

复制代码
  1 [root@master ~]# cd /usr/
  2 [root@master usr]# tar -zxvf hbase-1.0.3-bin.tar.gz		#解压hbase
  3 [root@master ~]# mkdir /usr/hbase-1.0.3/logs			#创建hbase的日志存放目录
  4 [root@master ~]# mkdir /usr/hbase-1.0.3/temp			#hbase的临时文件存放目录
  5 [root@master ~]# mkdir /usr/hbase-1.0.3/temp/pid		#hbase相关pid文件存放目录
复制代码
 

 

10.2 修改环境变量

复制代码
  1 [root@master ~]# vi /root/.bash_profile
  2 PATH=$PATH:$HOME/bin:$JAVA_HOME/bin:$ZOOKEEPER_HOME/bin:$HBASE_HOME/bin
  3 export PATH
  4 export JAVA_HOME=/usr/jdk1.8.0_111
  5 export HADOOP_HOME=/usr/hadoop-2.7.0
  6 export HADOOP_LOG_DIR=/usr/hadoop-2.7.0/logs
  7 export YARN_LOG_DIR=$HADOOP_LOG_DIR
  8 export ZOOKEEPER_HOME=/usr/zookeeper-3.4.9/
  9 export HBASE_HOME=/usr/hbase-1.0.3
 10 export HBASE_LOG_DIR=$HBASE_HOME/logs
 11 [root@master ~]# source /root/.bash_profile
 12 [root@master ~]# scp /root/.bash_profile slave01:/root/
 13 [root@master ~]# scp /root/.bash_profile slave02:/root/
复制代码
 

提示:三台主机都需要配置,可直接将环境变量复制给slave01和slave02。

复制代码
  1 [root@master ~]# vi /usr/hbase-1.0.3/conf/hbase-env.sh
  2 export JAVA_HOME=/usr/jdk1.8.0_111
  3 export HBASE_MANAGES_ZK=true
  4 export HBASE_CLASSPATH=/usr/hadoop-2.7.0/etc/hadoop/
  5 export HBASE_PID_DIR=/usr/hbase-1.0.3/temp/pid
复制代码
 

注意:分布式运行的一个Hbase依赖一个zookeeper集群。所有的节点和客户端都必须能够访问zookeeper。默认Hbase会管理一个zookeep集群,即HBASE_MANAGES_ZK=true,这个集群会随着 Hbase 的启动而启动。也可以采用独立的 zookeeper 来管理 hbase,即HBASE_MANAGES_ZK=false。

 

10.4 修改hbase-site.xml

复制代码
  1 [root@master ~]# vi /usr/hbase-1.0.3/conf/hbase-site.xml
  2 ……
  3 <configuration>
  4 <property>
  5         <name>hbase.rootdir</name>
  6         <value>hdfs://master:9000/hbase</value>
  7 </property>
  8 <property>
  9         <name>hbase.cluster.distributed</name>
 10         <value>true</value>
 11 </property>
 12 <property>
 13         <name>hbase.zookeeper.quorum</name>
 14         <value>slave01,slave02</value>
 15 </property>
 16 <property>
 17         <name>hbase.master.maxclockskew</name>
 18         <value>180000</value>
 19 </property>
 20 <property>
 21         <name>hbase.zookeeper.property.dataDir</name>
 22         <value>/usr/zookeeper-3.4.9/data</value>
 23 </property>
 24 <property>
 25         <name>hbase.tmp.dir</name>
 26         <value>/usr/hbase-1.0.3/temp</value>
 27 </property>
 28 <property>
 29         <name>hbase.master</name>
 30         <value>hdfs://master:60000</value>
 31 </property>
 32 <property>
 33         <name>hbase.master.info.port</name>
 34         <value>60010</value>
 35 </property>
 36 <property>
 37         <name>hbase.regionserver.info.port</name>
 38         <value>60030</value>
 39 </property>
 40 <property>
 41         <name>hbase.client.scanner.caching</name>
 42         <value>200</value>
 43 </property>
 44 <property>
 45         <name>hbase.balancer.period</name>
 46         <value>300000</value>
 47 </property>
 48 <property>
 49         <name>hbase.client.write.buffer</name>
 50         <value>10485760</value>
 51 </property>
 52 <property>
 53         <name>hbase.hregion.majorcompaction</name>
 54         <value>7200000</value>
 55 </property>
 56 <property>
 57         <name>hbase.hregion.max.filesize</name>
 58         <value>67108864</value>
 59 </property>
 60 <property>
 61         <name>hbase.hregion.memstore.flush.size</name>
 62         <value>1048576</value>
 63 </property>
 64 <property>
 65         <name>hbase.server.thread.wakefrequency</name>
 66         <value>30000</value>
 67 </property>
 68 </configuration>
 69 #直接将imxhy01的相关配置传送给imxhy02即可。
 70 [root@master ~]# scp -r /usr/hbase-1.0.3 root@imxhy02:/usr/
复制代码
 

 

10.5 配置 regionservers

  1 [root@master ~]# vi /usr/hbase-1.0.3/conf/regionservers
  2 slave01
  3 slave02
 

十一 启动hbase

复制代码
  1 [root@master ~]# cd /usr/hbase-1.0.3/bin/
  2 [root@master bin]# ./start-hbase.sh
  3 [root@slave01 ~]# cd /usr/hbase-1.0.3/bin/
  4 [root@slave01 bin]# ./hbase-daemon.sh start regionserver
  5 [root@slave02 ~]# cd /usr/hbase-1.0.3/bin/
  6 [root@slave02 bin]# ./hbase-daemon.sh start regionserver
复制代码
 

十二 测试

 

12.1 浏览器检测

浏览器访问:http://172.24.8.12:60010/master-status
03
 

 

12.2 java检测

复制代码
  1 [root@master ~]# /usr/jdk1.8.0_111/bin/jps
  2 21346 NameNode
  3 23301 Jps
  4 21703 ResourceManager
  5 21544 SecondaryNameNode
  6 22361 QuorumPeerMain
  7 23087 HMaster
  8 [root@slave01 ~]# jps
  9 17377 HRegionServer
 10 17457 Jps
 11 16038 NodeManager
 12 15928 DataNode
 13 16488 QuorumPeerMain
 14 15533 SecondaryNameNode
 15 [root@slave02 ~]# jps
 16 16400 QuorumPeerMain
 17 15507 SecondaryNameNode
 18 16811 HRegionServer
 19 17164 Jps
 20 16013 NodeManager
 21 15903 DataNode
posted @ 2019-01-16 12:20  裸奔的小鸵鸟  阅读(439)  评论(0编辑  收藏  举报