Hadoop高可用搭建

最终每个节点上的进程

ZK NN DN JN ZKFC
master
node1
node2
  • 1、防火墙

service firewalld stop

  • 2、时间同步

yum install ntp
ntpdate -u s2c.time.edu.cn
或者
date -s 20180503

  • 3、配置免密

ssh-keygen -t rsa
ssh-copy-id ip
master-->master,node1,node2
node1-->master,node1,node2

  • 4、修改Hadoop配置信息
    修改core-site.xml配置文件
<configuration>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://cluster</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/usr/local/soft/hadoop-3.1.2/tmp</value>
	</property>
	<property>
		<name>fs.trash.interval</name>
		<value>1440</value>
	</property>
	<property>
	      <name>ha.zookeeper.quorum</name>
	      <value>master:2181,node1:2181,node2:2181</value>
	</property>
</configuration>

修改hdfs-site.xml配置信息

<configuration>
<!-- 指定hdfs元数据存储的路径 -->
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/soft/hadoop-3.1.2/data/namenode</value>
</property>

<!-- 指定hdfs数据存储的路径 -->
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/soft/hadoop-3.1.2/data/datanode</value>
</property>

<!-- 数据备份的个数 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>

<!-- 关闭权限验证 -->
<property>
<name>dfs.permissions.enabled</name>
<value>false</value>
</property>

<!-- 开启WebHDFS功能(基于REST的接口服务) -->
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>

<!-- //////////////以下为HDFS HA的配置////////////// -->
<!-- 指定hdfs的nameservices名称为mycluster -->
<property>
<name>dfs.nameservices</name>
<value>cluster</value>
</property>

<!-- 指定cluster的两个namenode的名称分别为nn1,nn2 -->
<property>
<name>dfs.ha.namenodes.cluster</name>
<value>nn1,nn2</value>
</property>

<!-- 配置nn1,nn2的rpc通信端口 -->
<property>
<name>dfs.namenode.rpc-address.cluster.nn1</name>
<value>master:8020</value>
</property>
<property>
<name>dfs.namenode.rpc-address.cluster.nn2</name>
<value>node1:8020</value>
</property>

<!-- 配置nn1,nn2的http通信端口 -->
<property>
<name>dfs.namenode.http-address.cluster.nn1</name>
<value>master:9870</value>
</property>
<property>
<name>dfs.namenode.http-address.cluster.nn2</name>
<value>node1:9870</value>
</property>

<!-- 指定namenode元数据存储在journalnode中的路径 -->
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://master:8485;node1:8485;node2:8485/cluster</value>
</property>

<!-- 指定journalnode日志文件存储的路径 -->
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/soft/hadoop-3.1.2/data/journal</value>
</property>

<!-- 指定HDFS客户端连接active namenode的java类 -->
<property>
<name>dfs.client.failover.proxy.provider.cluster</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<!-- 配置隔离机制为ssh -->
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>

<!-- 指定秘钥的位置 -->
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>

<!-- 开启自动故障转移 -->
<property>  
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
</configuration>

修改hadoop-env.sh配置信息添加以下信息

export HDFS_JOURNALNODE_USER=root
export HDFS_ZKFC_USER=root

停止HDFS集群

stop-dfs.sh

  • 5、同步到其它节点

cd /usr/local/soft/hadoop-3.1.2/etc/hadoop
scp ./* node1:pwd
scp ./* node2:pwd

  • 6、删除hadoop数据存储目录下的文件 每个节点都需要删除

rm -rf tmp

  • 7、启动zookeeper 三台都需要启动

zkServer.sh start
master

node1

node2

  • 8、查看zookeeper状态

zkServer.sh status
master

node1

node2

  • 9、启动JN存储hdfs元数据

hadoop-daemon.sh start journalnode
master

node1

node2

  • 9、格式化hdfs,在一台NN上执行
    在master上执行

hdfs namenode -format

启动当前的NN

hadoop-daemon.sh start namenode

  • 10、执行同步,在没有格式化的NN上执行,在另外一个namenode上面执行,这里选择node1

hdfs namenode -bootstrapStandby

11、格式化ZK,在master上面执行

hdfs zkfc -formatZK

12、启动hdfs集群,在master上执行

start-dfs.sh

13、查看每个节点的jps进程
master

node1

node2

后续使用的步骤
1、开启虚拟机
2、每台机器先启动zk
3、在master上执行start-dfs.sh
4、关闭高可用hdfs stop-dfs.sh

posted @ 2024-11-04 19:57  w我自横刀向天笑  阅读(1)  评论(0编辑  收藏  举报