MySQL 5.7 主主+Keepalived架构
一、keepalived简介
keepalived是vrrp协议的实现,原生设计目的是为了高可用ipvs服务,keepalived能够配置文件中的定义生成ipvs规则,并能够对各RS的健康状态进行检测;通过共用的虚拟IP地址对外提供服务;每个热备组内同一时刻只有一台主服务器提供服务,其他服务器处于冗余状态,若当前在线的服务器宕机,其虚拟IP地址将会被其他服务器接替(优先级决定接替顺序),实现高可用为后端主机提供服务。
二、keepalived组件
Keepalived组件介绍
core:keepalived核心组件,主进程的启动和维护,全局配置等。
vrrp stack:keepalived是基于vrrp协议实现高可用vps服务,vrrp则为相关子进程为其提供服务
check:检测keepalived的健康状态相关进程
system call:系统调用
watch dog:监控check和vrrp进程的看管者,check负责检测器子进程的健康状态,当其检测到master上的服务不可用时则通告vrrp将其转移至backup服务器上。
三、环境准备
MySQL、Keepalived的具体版本,虚拟主机等配置,都尽可能参考客户目前的生产环境安装规范来准备:
软件名称 | 版本 |
---|---|
MySQL | 5.7.39 |
Keepalived | 2.0.20 |
准备2台虚拟主机,具体环境信息为:
系统版本 | 主机名 | IP地址 | 主机内存 | 磁盘空间 |
---|---|---|---|---|
CentOS 7.5 | db1 | 192.168.116.138 | 1G | 20G |
CentOS 7.5 | db2 | 192.168.116.138 | 1G | 20G |
规划业务连接的vip为:192.168.116.130
MySQL软件下载地址:https://downloads.mysql.com/archives/community/
Keepalived软件下载地址:https://www.keepalived.org/download.html
四、MySQL安装
略。。。。
五、MySQL主主配置
master1(138)中my.cnf文件配置
server-id=1 #数据库唯一ID,主从的标识号绝对不能重复。 log-bin=mysql-bin #开启bin-log,并指定文件目录和文件名前缀 binlog-do-db=lw #需要同步liting数据库。如果是多个同步库,就以此格式另写几行即可。如果不指明对某个具体库同步,就去掉此行,表示同步所有库(除了ignore忽略的库)。 binlog-ignore-db=mysql,performance_schema,informantion_schema,sys #不同步mysql系统数据库。如果是多个不同步库,就以此格式另写几行;也可以在一行,中间逗号隔开。 sync_binlog = 1 #确保binlog日志写入后与硬盘同步 binlog_checksum = none #跳过现有的采用checksum的事件,mysql5.6.5以后的版本中binlog_checksum=crc32,而低版本都是binlog_checksum=none binlog_format = mixed #bin-log日志文件格式,设置为MIXED可以防止主键重复。 auto_increment_offset=1 表示自增长字段从那个数开始,取值范围是1 .. 65535。这个就是序号。如果有n台mysql机器,则从第一台开始分为设1,2...n auto_increment_increment=2 表示自增长字段每次递增的量,其默认值是1,取值范围是1 .. 65535。如果有n台mysql机器,这个值就设置为n。 温馨提示:在主服务器上最重要的二进制日志设置是sync_binlog,这使得mysql在每次提交事务的时候把二进制日志的内容同步到磁盘上,即使服务器崩溃也会把事件写入日志中。 sync_binlog这个参数是对于MySQL系统来说是至关重要的,他不仅影响到Binlog对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。对于"sync_binlog"参数的各种设置的说明如下: sync_binlog=0,当事务提交之后,MySQL不做fsync之类的磁盘同步指令刷新binlog_cache中的信息到磁盘,而让Filesystem自行决定什么时候来做同步,或者cache满了之后才同步到磁盘。 sync_binlog=n,当每进行n次事务提交之后,MySQL将进行一次fsync之类的磁盘同步指令来将binlog_cache中的数据强制写入磁盘。
配置master1 (138)数据库
grant replication slave, replication client on *.* to 'repl'@'192.168.116.%' identified by "123456"; flush privileges; flush tables with read lock; /* 注意该参数设置后,如果自己同步对方数据,同步前一定要记得先解锁!*/ show master status;
结果如下:
show master status; +-----------------+----------+--------------+------------------+------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +-----------------+----------+--------------+------------------+------------------------------------------+ | mybinlog.000115 | 150 | | mysql,performance_schema,informantion_schema,sys | | +-----------------+----------+--------------+------------------+------------------------------------------+ 1 row in set (0.00 sec)
master2(139)中my.cnf文件配置
server-id=2 #数据库唯一ID,主从的标识号绝对不能重复。 log-bin=mysql-bin #开启bin-log,并指定文件目录和文件名前缀 binlog-do-db=lw #需要同步liting数据库。如果是多个同步库,就以此格式另写几行即可。如果不指明对某个具体库同步,就去掉此行,表示同步所有库(除了ignore忽略的库)。 binlog-ignore-db=mysql,performance_schema,informantion_schema,sys #不同步mysql系统数据库。如果是多个不同步库,就以此格式另写几行;也可以在一行,中间逗号隔开。 sync_binlog = 1 #确保binlog日志写入后与硬盘同步 binlog_checksum = none #跳过现有的采用checksum的事件,mysql5.6.5以后的版本中binlog_checksum=crc32,而低版本都是binlog_checksum=none binlog_format = mixed #bin-log日志文件格式,设置为MIXED可以防止主键重复。 auto_increment_offset=2 表示自增长字段从那个数开始,取值范围是1 .. 65535。这个就是序号。如果有n台mysql机器,则从第一台开始分为设1,2...n auto_increment_increment=2 表示自增长字段每次递增的量,其默认值是1,取值范围是1 .. 65535。如果有n台mysql机器,这个值就设置为n。 温馨提示:在主服务器上最重要的二进制日志设置是sync_binlog,这使得mysql在每次提交事务的时候把二进制日志的内容同步到磁盘上,即使服务器崩溃也会把事件写入日志中。 sync_binlog这个参数是对于MySQL系统来说是至关重要的,他不仅影响到Binlog对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。对于"sync_binlog"参数的各种设置的说明如下: sync_binlog=0,当事务提交之后,MySQL不做fsync之类的磁盘同步指令刷新binlog_cache中的信息到磁盘,而让Filesystem自行决定什么时候来做同步,或者cache满了之后才同步到磁盘。 sync_binlog=n,当每进行n次事务提交之后,MySQL将进行一次fsync之类的磁盘同步指令来将binlog_cache中的数据强制写入磁盘。
配置master2 (139)数据库
grant replication slave, replication client on *.* to 'repl'@'192.168.116.%' identified by "123456"; flush privileges; flush tables with read lock; /* 注意该参数设置后,如果自己同步对方数据,同步前一定要记得先解锁!*/ show master status;
结果如下:
show master status; +-----------------+----------+--------------+------------------+------------------------------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set | +-----------------+----------+--------------+------------------+------------------------------------------+ | mybinlog.000115 | 150 | | mysql,performance_schema,informantion_schema,sys | | +-----------------+----------+--------------+------------------+------------------------------------------+ 1 row in set (0.00 sec)
Master1 同步 Master2
在master1(138)上做以下操作,注意master_host输入master2地址,以及master2的show master status信息:
mysql -uroot -p'123456' unlock tables; /*先解锁,将对方数据同步到自己的数据库中*/ stop slave; change master to master_host='192.168.116.139', master_user='repl', master_password='123456', master_log_file='mybinlog.000115', master_log_pos=150; start slave;
查看同步状态,如下出现两个“Yes”,表明同步成功:
show slave status\G
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Master2 同步 Master1
在master2(139)上做以下操作,注意master_host输入master1地址,以及master1的show master status信息:
mysql -uroot -p'123456' unlock tables; /*先解锁,将对方数据同步到自己的数据库中*/ stop slave; change master to master_host='192.168.116.138', master_user='repl', master_password='123', master_log_file='mybinlog.000115', master_log_pos=150; start slave;
查看同步状态,如下出现两个“Yes”,表明同步成功:
show slave status\G
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
验证主主同步正常
在master1(138)上创建一个测试库lw1;创建表haha,插入一条数据,然后去master2(139)查询确认同步;
在master2(139)上创建一个测试库lw2;创建表haha2,插入一条数据,然后去master1(138)查询确认同步。
1)在master1数据库上写入新数据 mysql> unlock tables; Query OK, 0 rows affected (0.00 sec) mysql> create database lw1; Query OK, 1 row affected (0.01 sec) mysql> use lw1; Database changed mysql> create table if not exists haha ( id int(10) PRIMARY KEY AUTO_INCREMENT, name varchar(50) NOT NULL); Query OK, 0 rows affected (0.04 sec) mysql> insert into haha values(2,'guojing'); Query OK, 1 row affected (0.00 sec) mysql> insert into haha values(1,"huangrong"); Query OK, 1 row affected (0.00 sec) mysql> select * from haha; +----+-----------+ | id | name | +----+-----------+ | 1 | huangrong | | 2 | guojing | +----+-----------+ 2 rows in set (0.00 sec) 然后在master2数据库上查看,发现数据已经同步过来了! mysql> select * from lw1.haha; +----+-----------+ | id | name | +----+-----------+ | 1 | huangrong | | 2 | guojing | +----+-----------+ 2 rows in set (0.00 sec)
六、Keepalived安装部署
安装keepalived软件
需要准备的系统依赖包:
gcc libnl-1.1.4-2.el6.x86_64 libnl-devel-1.1.4-2.el6.x86_64 libnfnetlink-1.0.0-1.el6.x86_64 libnfnetlink-devel-1.0.0-1.el6.x86_64 openssl-devel-1.0.1e-58.el6_10.x86_64
配置好yum源,使用yum install安装对应的包。
yum install gcc libnl libnl-devel libnfnetlink libnfnetlink-devel openssl-devel
编译安装keepalived
解压及配置:
tar -xvf keepalived-2.0.20.tar.gz mv keepalived-2.0.20 /usr/local/src/ cd /usr/local/src/keepalived-2.0.20 ./configure --prefix=/usr/local/keepalived
编译安装:
make && make install
配置keepalived服务
配置服务文件
mkdir /etc/keepalived cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/ cp /usr/local/keepalived/sbin/keepalived /usr/sbin cp /usr/local/src/keepalived-2.0.20/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/keepalived
加keepalived服务
chkconfig --list |grep keepalived chkconfig --add keepalived chkconfig keepalived on
配置keepalived日志
keepalived的日志默认是输出到/var/log/messages中,这样不便于查看。如何自定义keepalived的日志输出文件呢?
如果是用service启动的,修改/etc/sysconfig/keepalived文件
vi /etc/sysconfig/keepalived
KEEPALIVED_OPTIONS="-D -d -S 0"
如果不是,则启动的时候指定以上参数,如:
/usr/local/keepalived/sbin/keepalived -d -D -S 0
修改/etc/syslog.conf(RHEL6.8以后配置/etc/rsyslog.conf)
# keepalived -S 0 local0.* /var/log/keepalived.log
重启syslog:
# RHEL 5&6: service syslog restart # RHEL 7: service rsyslog restart
注:RHEL6.8也是按照RHEL7的方法来操作。
配置keepalived的MySQL故障转移
master1(138)机器上的keepalived.conf配置:
注:下面配置中没有使用lvs的负载均衡功能,所以不需要配置虚拟服务器virtual server
cd /etc/keepalived/
mv keepalived.conf keepalived.conf.bak
vi /etc/keepalived/keepalived.conf
! Configuration File for keepalived vrrp_script chk_mysql_port { script "/etc/keepalived/check_mysql.sh" interval 2 weight -5 fall 2 rise 1 } vrrp_instance VI_1 { state MASTER interface ens33 #指定虚拟ip的网卡接口 mcast_src_ip 192.168.116.138 #指定本服务器物理ip地址 virtual_router_id 130 #路由器标识,MASTER和BACKUP必须是一致的,取值1-255,注意同一内网中不应有相同virtual_router_id的集群,可以考虑使用vip的最后一位进行标示。 priority 101 advert_int 1 authentication { auth_type PASS auth_pass 888888 } virtual_ipaddress { 192.168.116.130 #指定虚拟ip地址 } track_script { chk_mysql_port } }
编辑 /etc/keepalived/check_mysql.sh
vi /etc/keepalived/check_mysql.sh
#!/bin/bash counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l) if [ "${counter}" -eq 0 ]; then /etc/init.d/keepalived stop fi # 修改chk_mysql.sh权限 chmod 755 /etc/keepalived/check_mysql.sh # 启动keepalived # service keepalived start Starting keepalived: [ OK ]
master2(139)机器上的keepalived.conf配置:
cd /etc/keepalived/ mv keepalived.conf keepalived.conf.bak vi /etc/keepalived/keepalived.conf ! Configuration File for keepalived vrrp_script chk_mysql_port { script "/etc/keepalived/check_mysql.sh" interval 2 weight -5 fall 2 rise 1 } vrrp_instance VI_1 { state BACKUP interface ens33 mcast_src_ip 192.168.116.139 virtual_router_id 130 priority 99 advert_int 1 authentication { auth_type PASS auth_pass 888888 } virtual_ipaddress { 192.168.116.130 } track_script { chk_mysql_port } }
编辑check_mysql.sh
vi /etc/keepalived/check_mysql.sh
#!/bin/bash counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l) if [ "${counter}" -eq 0 ]; then /etc/init.d/keepalived stop fi
chmod 755 /etc/keepalived/check_mysql.sh
启动keepalived:
service keepalived start Starting keepalived: [ OK ]
查看keepalived日志:
tail -200f /var/log/keepalived.log
创建数据库、用户并赋权
--创建业务用户: create user 'admin'@'%' identified by '123456'; --赋予业务用户权限(默认): grant insert,update,delete,select,alter,create,index,SHOW VIEW on lw1.* to 'admin'@'%';
此时应用侧已经可以使用命令mysql -uadmin -p -h192.168.1.130
或者客户端连接工具,登录到数据库进行相关操作了。
mysql -uadmin -p -h192.168.116.130
七、Mysql+keepalived故障转移的高可用测试
停止master1机器上的mysql服务,根据配置中的脚本,mysql服务停了,keepalived也会停,从而vip资源将会切换到master2机器上。(mysql服务没有起来的时候,keepalived服务也无法顺利启动!)
再次启动master1的mysql和keepalived服务。(注意:如果restart重启mysql,那么还要启动下keepalived,因为mysql重启,根据脚本会造成keepalived关闭)
注意:一定要先启动mysql服务,然后再启动keepalived服务。如果先启动keepalived服务,按照上面的配置,mysql没有起来,就会自动关闭keepalived。
八、Keepalived的抢占和非抢占模式
keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。
VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。
控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。
一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。
keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。
1)抢占模式:
主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。
也就是说,工作在抢占模式下,不分主备,只管优先级。
如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。
priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!!
2)非抢占模式:
这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。
并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。
千万注意:
nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!
也就是说:
a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式!
b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。
c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。即使优先级高的那一台机器恢复 后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。
九、mysql状态检测脚本优化
上面的mysql监测脚本有点过于简单且粗暴,即脚本一旦监测到Master的mysql服务关闭,就立刻把keepalived服务关闭,从而实现vip转移!
下面对该脚本进行优化,优化后,当监测到Master的mysql服务关闭后,就会将vip切换到Backup上(但此时Master的keepalived服务不会被暴力kill)
当Master的mysql服务恢复后,就会再次将VIP资源切回来!
#!/bin/bash MYSQL=/usr/bin/mysql MYSQL_HOST=localhost MYSQL_USER=root MYSQL_PASSWORD=1qaz@WSX CHECK_TIME=3 #mysql is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0 MYSQL_OK=1 function check_mysql_helth (){ $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1 if [ $? = 0 ] ;then MYSQL_OK=1 else MYSQL_OK=0 fi return $MYSQL_OK } while [ $CHECK_TIME -ne 0 ] do let "CHECK_TIME -= 1" check_mysql_helth if [ $MYSQL_OK = 1 ] ; then CHECK_TIME=0 exit 0 fi if [ $MYSQL_OK -eq 0 ] && [ $CHECK_TIME -eq 0 ] then pkill keepalived exit 1 fi sleep 1 done