MHA 实践

1 Mysql mha简介

MHA (Master Hight Availability) 是目前在Mysql高可用方面一个相对成熟的解决方案,也是在Mysql高可用环境下故障切换和主从提升的常用软件。在Mysql 故障切换过程中,MHA 能极短时间内自动完成数据库的故障切换操作。

MHA软件由两部分组成:MHA manager(管理节点)和MHA node(数据节点)。MHA manager会定时探测集群中的master节点,当master出现故障时,它可以自动将有最新数据的slave提升为新的master,然后所有其他的slave指向新的master。

MHA软件由两部分组成:Manager工具包和Node工具包,MHA 安装完成后,服务器上会自动生成如下脚本。具体说明如下:

MHA Manager:

1. masterha_check_ssh:检查MHA的SSH配置状况

2. masterha_check_repl:检查MySQL的复制状况

3. masterha_manager:启动MHA

4. masterha_check_status:检测当前MHA运行状态

5. masterha_master_monitor:检测master是否宕机

6. masterha_master_switch:控制故障转移(自动或手动)

7. masterha_conf_host:添加或删除配置的server信息

8. masterha_stop:关闭MHA

 

MHA Node:

save_binary_logs:保存或复制master的二进制日志

apply_diff_relay_logs:识别差异的relay log并将差异的event应用到其它slave中

filter_mysqlbinlog:去除不必要的ROLLBACK事件(MHA已不再使用这个工具)

purge_relay_logs:消除中继日志(不会堵塞SQL线程)

另有切换告警的几个脚本需自定义:

1. master_ip_failover:管理VIP

2. master_ip_online_change:

3. masterha_secondary_check:当MHA manager检测到master不可用时,通过masterha_secondary_check脚本来进一步确认,减低误切的风险。

4. send_report:当发生故障切换时,可通过send_report脚本发送告警信息。

目前MHA主要支持一主多从的架构,要搭建MHA,要求一个复制集中必须最少有3台数据服务器,一主二从,即一台充当master,一台充当备库,一台充当从库。

2 mha安装配置规划

安装前环境准备:

IP

端口

路径

mysql版本

mha角色

用途

需要安装软件

192.168.56.121

13306

/usr/local/

5.7.25

mha-node

master主节点

(数据节点)

mha4mysql-node-0.56-0.el6.noarch.rpm

192.168.56.130

13306

/usr/local/

5.7.25

mha-node+mha-manager

slave从库

(管理节点)

mha4mysql-node-0.56-0.el6.noarch.rpm+mha4mysql-manager-0.56-0.el6.noarch

192.168.56.122

13306

/usr/local/

5.7.25

mha-node

slave从库

(数据节点)

mha4mysql-node-0.56-0.el6.noarch.rpm

3 Mysql5.7安装(一主两从安装)

下载mysql-5.7.25-linux-glibc2.12-x86_64.tar安装包上传服务器对应安装目录/usr/local

3.1 创建用户

 [root@hdp-01 ~]# groupadd mysql

[root@hdp-01 ~]# useradd -g mysql  mysql

3.2 创建目录

 [root@hdp-01 /]# mkdir -pv /app/mysql_gtid/

3.3 安装

[root@mysql opt]# cd /usr/local/

[root@mysql local]# tar -xvf mysql-5.7.25-linux-glibc2.12-x86_64.tar

mysql-5.7.25-linux-glibc2.12-x86_64.tar.gz

mysql-test-5.7.25-linux-glibc2.12-x86_64.tar.gz

[root@mysql local]# tar -zxvf mysql-5.7.25-linux-glibc2.12-x86_64.tar.gz

解压缩后,建软链接

[root@mysql local]# ln -s mysql-5.7.25-linux-glibc2.12-x86_64  mysql

[root@mysql mysql]# chown mysql:mysql -R /usr/local/mysql

[root@mysql mysql]# chown mysql:mysql -R /app/mysql_gtid/

修改mysql配置文件,主节点配置文件

[root@mysql ~]# vi /etc/my.cnf

[root@mysql ~]# cat /etc/my.cnf

[client]

socket = /app/mysql_gtid/mysql.sock

[mysqld]

port=13306

character_set_server=utf8

basedir=/usr/local/mysql

datadir=/app/mysql_gtid

socket=/app/mysql_gtid/mysql.sock

log-error=/app/mysql_gtid/mysqld.log

pid-file=/app/mysql_gtid/mysqld.pid

lower_case_table_names = 1

sql_mode=STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION

max_connections=5000

default-time_zone = '+8:00'

gtid_mode=ON

enforce-gtid-consistency=ON

binlog_format=row

log-bin=/app/mysql_gtid/mysql-bin

master-info-repository=TABLE

relay-log-info-repository=TABLE

server-id=1313306

从节点my.cnf配置文件:

[root@weblogic ~]# cat /etc/my.cnf

[client]

socket = /app/mysql_gtid/mysql.sock

[mysqld]

port=3306

character_set_server=utf8

basedir=/usr/local/mysql

datadir=/app/mysql_gtid

socket=/app/mysql_gtid/mysql.sock

log-error=/app/mysql_gtid/mysqld.log

pid-file=/app/mysql_gtid/mysqld.pid

lower_case_table_names = 1

sql_mode=STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION

max_connections=5000

default-time_zone = '+8:00'

gtid_mode=ON

enforce-gtid-consistency=ON

log_slave_updates=ON

skip-slave-start=1

binlog_format=row

log-bin=/app/mysql_gtid/mysql-bin

server-id=1303306

mysql初始化:

[root@mysql etc]# /usr/local/mysql/bin/mysqld --initialize  --basedir=/usr/local/mysql --datadir=/app/mysql_gtid   --user=mysql  --explicit_defaults_for_timestamp

密码:root@localhost: k5h%h9#15ffA

启动msyql:

[root@mysql support-files]# cp /usr/local/mysql/support-files/mysql.server   /etc/init.d/mysqld

[root@mysql mysql]# /etc/init.d/mysqld  start

Starting MySQL.Logging to '/app/mysql/mysql.err'.

 SUCCESS!

[root@mysql  ~]# mysql -uroot -pk5h%h9#15ffA

mysql: [Warning] Using a password on the command line interface can be insecure.

ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)

[root@mysql ~]# find /app   -name mysql.sock

/app/mysql/mysql.sock

建立软链接解决报错问题。

[root@mysql ~]# ln -s /app/mysql/mysql.sock  /tmp/mysql.sock

[root@mysql ~]#

[root@mysql ~]# mysql -uroot -pk5h%h9#15ffA

mysql: [Warning] Using a password on the command line interface can be insecure.

Welcome to the MySQL monitor.  Commands end with ; or \g.

Your MySQL connection id is 2

Server version: 5.7.25-log

Copyright (c) 2000, 2019, Oracle and/or its affiliates. All rights reserved.

Oracle is a registered trademark of Oracle Corporation and/or its

affiliates. Other names may be trademarks of their respective

owners.

Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

mysql> show databases;

ERROR 1820 (HY000): You must reset your password using ALTER USER statement before executing this statement.

mysql> set password='mysql123';

Query OK, 0 rows affected (0.01 sec)

mysql> alter user 'root'@'localhost' password expire never;

Query OK, 0 rows affected (0.03 sec)

mysql> flush privileges;

Query OK, 0 rows affected (0.01 sec)

3.4 主服务器上建立帐户并授权

mysql>  GRANT REPLICATION SLAVE ON *.* to 'mysync'@'%' identified by 'Mq_12345!6';

Query OK, 0 rows affected, 1 warning (0.01 sec)

mysql> flush privileges;

Query OK, 0 rows affected (0.00 sec)

3.5 从服务器上开启同步数据

mysql>change master to master_host='192.168.56.121',master_user='mysync',master_password='Mq_12345!6',master_port=13306, master_auto_position=1;

mysql> start slave;

Query OK, 0 rows affected (0.01 sec)

通过slave的状态信息,可以看到GTID的值、Matser_UUID等信息,出现这两个yes。表示一主两从同步配置成功。

4 配置三台服务器节点SSH互信

MHA集群中的各节点彼此之间均需要基于ssh互信互通,以实现远程控制及数据管理功能。

1)打开ssh配置文件,启用以下选项

RSAAuthentication yes     #允许RSA认证

PubkeyAuthentication yes  #允许公钥认证

AuthorizedKeysFile      .ssh/authorized_keys   #公钥存放地址

PermitRootLogin yes    #如果要以root身份ssh互信登陆

2)# 生成公钥并分发其他服务器

ssh-keygen -t rsa   连续回车

 

 

 

2)#将公钥添加到认证文件,并将认证文件整合在一个文件。

[root@pxc3 ~]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

#设置authorized_keys的访问权限:

[root@pxc3 ~]#chmod 600 ~/.ssh/authorized_keys

[root@pxc3 ~]# ssh 192.168.56.121  cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys
[root@pxc3 ~]# ssh 192.168.56.130  cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

3)# 分发整合后的公钥文件到其它节点

scp ~/.ssh/authorized_keys 192.168.56.121:~/.ssh/
scp ~/.ssh/authorized_keys 192.168.56.130:~/.ssh/

[root@pxc3 ~]# scp ~/.ssh/authorized_keys 192.168.56.121:~/.ssh/

root@192.168.56.121's password:

authorized_keys                                                                                                                               100% 1173     1.2KB/s   00:00    

[root@pxc3 ~]# scp ~/.ssh/authorized_keys 192.168.56.130:~/.ssh/

root@192.168.56.130's password:

authorized_keys                                                                                                                                           100% 1173     1.2KB/s   00:00    

[root@pxc3 ~]#

4)# 测试时,第一次,需要输入密码,之后就不需要输入密码了。

在122 pxc3 测试其他2个节点ssh 互信连通性

[root@pxc3 ~]# ssh  192.168.56.130

[root@pxc2 ~]# ssh  192.168.56.121

在121 pxc1 测试其他2个节点ssh 互信连通性

[root@pxc1 ~]# ssh 192.168.56.122

[root@pxc3 ~]# ssh 192.168.56.130

在130pxc2 测试其他2个节点ssh 互信连通性

[root@pxc2 ~]# ssh 192.168.56.121

[root@pxc1 ~]# ssh 192.168.56.122

以上验证说明ssh 互信免密登陆配置完成。

5 部署MHA软件

以下是部署MHA高可用的具体操作步骤:

5.1 安装所需依赖

安装最新的阿里云的EPEL源

 wget -O /etc/yum.repos.d/CentOS-Base.repo  http://mirrors.aliyun.com/repo/Centos-6.repo

wget -O /etc/yum.repos.d/epel-6.repo  http://mirrors.aliyun.com/repo/epel-6.repo

[root@pxc2 ~]# rpm -ivh mha4mysql-manager-0.56-0.el6.noarch.rpm

error: Failed dependencies:

perl(Config::Tiny) is needed by mha4mysql-manager-0.56-0.el6.noarch

perl(Log::Dispatch) is needed by mha4mysql-manager-0.56-0.el6.noarch

perl(Log::Dispatch::File) is needed by mha4mysql-manager-0.56-0.el6.noarch

perl(Log::Dispatch::Screen) is needed by mha4mysql-manager-0.56-0.el6.noarch

perl(Parallel::ForkManager) is needed by mha4mysql-manager-0.56-0.el6.noarch

perl(Time::HiRes) is needed by mha4mysql-manager-0.56-0.el6.noarch

#yum clean all

#yum update

yum -y install  perl-Config-Tiny

yum -y install  perl-Log-Dispatch

yum -y install  perl-Parallel-ForkManager

yum -y install  perl-Time-HiRes

如果不能访问外网的环境,需要分别下载对应操作系统所依赖的rpm包。

登录网址http://rpm.pbone.net/

下载perl-Log-Dispatch-2.26-1.el6.rf.noarch.rpm

和perl-Parallel-ForkManager-0.7.5-2.2.el6.rf.noarch.rpm、

perl-Time-HiRes-1.9724-1.el6.rfx.x86_64.rpm、perl-Config-Tiny-2.20-1.3.noarch.rpm等。

5.2 安装管理节点

 

5.3 安装node节点

[root@pxc1 ~]# rpm -ivh  mha4mysql-node-0.56-0.el6.noarch.rpm

Preparing...                ########################################### [100%]

   1:mha4mysql-node         ########################################### [100%]

[root@pxc2 ~]# rpm -ivh  mha4mysql-node-0.56-0.el6.noarch.rpm

Preparing...                ########################################### [100%]

   1:mha4mysql-node         ########################################### [100%]

[root@pxc3 ~]# rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm

Preparing...                ########################################### [100%]

   1:mha4mysql-node         ########################################### [100%]

[root@pxc3 ~]#

5.4 配置mha管理账号

 

122、130节点同样执行授权建用户语句。

5.5 配置mha配置文件

[root@pxc2 conf]# vim mha.cnf

[server default]

user=mha

password=My_hA!0713

ping_interval=2

ssh_user=root

manager_workdir=/opt/mha/work/mha.log

manager_log=/opt/mha/log/mha.log

master_binlog_dir=/opt/mha/mha_binglog/

repl_user=mysync

repl_password=q123456

[server1]

hostname=pxc1

port=13306

[server2]

hostname=pxc2

port=13306

[server3]

hostname=pxc3

port=13306

在server default中的配置,是三台机器共同的配置。

5.6 检测mha配置

5.6.1 检测SSH登陆

 

 5.6.2 检测当前主从同步状态

检测主从同步状态发现报错1045 Access ,mha用户登录失败所致的。应该是建用户mha有问题,更正如下:

 

 

 依然有报错如下:

 

 所有的从节点要有相同的复制规则,检查2个slave 节点my.cnf配置文件,配置文件修改成一致。还是有报错。

 

 在所有数据节点上都创建软连接:

[root@pxc2 log]#  ln -s  /usr/local/mysql/bin/mysqlbinlog  /usr/bin/mysqlbinlog

[root@pxc2 log]#  ln  -s  /usr/local/mysql/bin/mysql   /usr/bin/mysql

问题解决,主从同步状态检测成功。

[root@pxc2 log]# masterha_check_repl   --conf=/opt/mha/conf/mha.cnf

 

 5.7 启动mha服务

[root@pxc2 ~]# masterha_manager  --conf=/opt/mha/conf/mha.cnf

Sun Jun 21 22:37:08 2020 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.

Sun Jun 21 22:37:08 2020 - [info] Reading application default configuration from /opt/mha/conf/mha.cnf..

Sun Jun 21 22:37:08 2020 - [info] Reading server configuration from /opt/mha/conf/mha.cnf..

 

    mha监控识别到当前主节点是192.168.56.121 pxc1 节点。

6 mha故障转移测试验证

当前主库pxc1(192.168.56.121) :

 

 6.1  手工在线切换

在线切换步骤:

1. 关闭MHA监控

 2、在线切换

  masterha_master_switch  --conf=/opt/mha/conf/mha.cnf  --master_state=alive --new_master_host=192.168.56.122 --new_master_port=13306 --orig_master_is_new_slave --running_updates_limit=10000

orig_master_is_new_slave是将原master切换为新主的slave ;

running_updates_limit 默认为1s,即如果主从延迟时间(Seconds_Behind_Master),或master show processlist中dml操作大于1s,则不会执行切换。

注意此处的new_master_host 要使用主机名,不要使用IP地址。否则会报如下错误:

 

 使用主机名继续切换:

masterha_master_switch  --conf=/opt/mha/conf/mha.cnf  --master_state=alive --new_master_host=pxc3 --new_master_port=13306 --orig_master_is_new_slave --running_updates_limit=10000

 

  

 

 

6.2  在线自动切换

1、编辑自动切换perl脚本

 

  

2、修改mha配置文件

修改当前mha.conf文件,指定自动切换脚本路径。

 

 3、在当前master节点上绑定vip

/sbin/ifconfig eth0:0 192.168.56.100  netmask 255.255.255.0  up

 

 4、模拟主库宕机pxc1

 

 5、查看vip漂移情况,查看tail -fn20 mha.log

 

 

 

Disabling the vip on old master pxc1(192.168.56.121),vip 在new master pxc2 上启用。

6、查看管理节点MHA切换日志

 

Master failover to pxc2(192.168.56.130)

7、查看mha自动切换后的主从同步关系

 

 可以看到,192.168.56.130成为新的master,192.168.56.122也自动指向了这个新的master节点。

posted @ 2020-06-29 12:12  beawh  阅读(375)  评论(0编辑  收藏  举报