keepalived是vrrp协议的实现,原生设计目的是为了高可用ipvs服务,keepalived能够配置文件中的定义生成ipvs规则,并能够对各RS的健康状态进行检测;通过共用的虚拟IP地址对外提供服务;每个热备组内同一时刻只有一台主服务器提供服务,其他服务器处于冗余状态,若当前在线的服务器宕机,其虚拟IP地址将会被其他服务器接替(优先级决定接替顺序),实现高可用为后端主机提供服务。

二、keepalived组件

   Keepalived组件介绍

wKiom1gVgVqxP0nVAADi2pjRuog301.png

core:keepalived核心组件,主进程的启动和维护,全局配置等。

vrrp stack:keepalived是基于vrrp协议实现高可用vps服务,vrrp则为相关子进程为其提供服务

check:检测keepalived的健康状态相关进程 

system call:系统调用

watch dog:监控check和vrrp进程的看管者,check负责检测器子进程的健康状态,当其检测到master上的服务不可用时则通告vrrp将其转移至backup服务器上。

三、环境准备

MySQL、Keepalived的具体版本,虚拟主机等配置,都尽可能参考客户目前的生产环境安装规范来准备:

软件名称版本
MySQL 5.7.39
Keepalived 2.0.20

准备2台虚拟主机,具体环境信息为:

系统版本主机名IP地址主机内存磁盘空间
CentOS 7.5 db1 192.168.116.138 1G 20G
CentOS 7.5 db2 192.168.116.138 1G 20G

规划业务连接的vip为:192.168.116.130

MySQL软件下载地址:https://downloads.mysql.com/archives/community/
Keepalived软件下载地址:https://www.keepalived.org/download.html

四、MySQL安装

     略。。。。

五、MySQL主主配置

 master1(138)中my.cnf文件配置

 server-id=1       #数据库唯一ID,主从的标识号绝对不能重复。
 log-bin=mysql-bin   #开启bin-log,并指定文件目录和文件名前缀
 binlog-do-db=lw  #需要同步liting数据库。如果是多个同步库,就以此格式另写几行即可。如果不指明对某个具体库同步,就去掉此行,表示同步所有库(除了ignore忽略的库)。
 binlog-ignore-db=mysql,performance_schema,informantion_schema,sys #不同步mysql系统数据库。如果是多个不同步库,就以此格式另写几行;也可以在一行,中间逗号隔开。
 sync_binlog = 1      #确保binlog日志写入后与硬盘同步
 binlog_checksum = none  #跳过现有的采用checksum的事件,mysql5.6.5以后的版本中binlog_checksum=crc32,而低版本都是binlog_checksum=none
 binlog_format = mixed   #bin-log日志文件格式,设置为MIXED可以防止主键重复。
 auto_increment_offset=1     表示自增长字段从那个数开始,取值范围是1 .. 65535。这个就是序号。如果有n台mysql机器,则从第一台开始分为设1,2...n
 auto_increment_increment=2    表示自增长字段每次递增的量,其默认值是1,取值范围是1 .. 65535。如果有n台mysql机器,这个值就设置为n。
温馨提示:在主服务器上最重要的二进制日志设置是sync_binlog,这使得mysql在每次提交事务的时候把二进制日志的内容同步到磁盘上,即使服务器崩溃也会把事件写入日志中。
   sync_binlog这个参数是对于MySQL系统来说是至关重要的,他不仅影响到Binlog对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。对于"sync_binlog"参数的各种设置的说明如下:
   sync_binlog=0,当事务提交之后,MySQL不做fsync之类的磁盘同步指令刷新binlog_cache中的信息到磁盘,而让Filesystem自行决定什么时候来做同步,或者cache满了之后才同步到磁盘。
   sync_binlog=n,当每进行n次事务提交之后,MySQL将进行一次fsync之类的磁盘同步指令来将binlog_cache中的数据强制写入磁盘。

 配置master1 (138)数据库

grant replication slave, replication client on *.* to 'repl'@'192.168.116.%' identified by "123456";
flush privileges;
flush tables with read lock; /* 注意该参数设置后,如果自己同步对方数据,同步前一定要记得先解锁!*/
show master status;

结果如下:

show master status;
+-----------------+----------+--------------+------------------+------------------------------------------+
| File            | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set                        |
+-----------------+----------+--------------+------------------+------------------------------------------+
| mybinlog.000115 |     150 |              | mysql,performance_schema,informantion_schema,sys           |  |
+-----------------+----------+--------------+------------------+------------------------------------------+
1 row in set (0.00 sec)

 

master2(139)中my.cnf文件配置

server-id=2       #数据库唯一ID,主从的标识号绝对不能重复。
 log-bin=mysql-bin   #开启bin-log,并指定文件目录和文件名前缀
 binlog-do-db=lw  #需要同步liting数据库。如果是多个同步库,就以此格式另写几行即可。如果不指明对某个具体库同步,就去掉此行,表示同步所有库(除了ignore忽略的库)。
 binlog-ignore-db=mysql,performance_schema,informantion_schema,sys #不同步mysql系统数据库。如果是多个不同步库,就以此格式另写几行;也可以在一行,中间逗号隔开。
 sync_binlog = 1      #确保binlog日志写入后与硬盘同步
 binlog_checksum = none  #跳过现有的采用checksum的事件,mysql5.6.5以后的版本中binlog_checksum=crc32,而低版本都是binlog_checksum=none
 binlog_format = mixed   #bin-log日志文件格式,设置为MIXED可以防止主键重复。
 auto_increment_offset=2     表示自增长字段从那个数开始,取值范围是1 .. 65535。这个就是序号。如果有n台mysql机器,则从第一台开始分为设1,2...n
 auto_increment_increment=2    表示自增长字段每次递增的量,其默认值是1,取值范围是1 .. 65535。如果有n台mysql机器,这个值就设置为n。
温馨提示:在主服务器上最重要的二进制日志设置是sync_binlog,这使得mysql在每次提交事务的时候把二进制日志的内容同步到磁盘上,即使服务器崩溃也会把事件写入日志中。
   sync_binlog这个参数是对于MySQL系统来说是至关重要的,他不仅影响到Binlog对MySQL所带来的性能损耗,而且还影响到MySQL中数据的完整性。对于"sync_binlog"参数的各种设置的说明如下:
   sync_binlog=0,当事务提交之后,MySQL不做fsync之类的磁盘同步指令刷新binlog_cache中的信息到磁盘,而让Filesystem自行决定什么时候来做同步,或者cache满了之后才同步到磁盘。
   sync_binlog=n,当每进行n次事务提交之后,MySQL将进行一次fsync之类的磁盘同步指令来将binlog_cache中的数据强制写入磁盘。

 配置master2 (139)数据库

grant replication slave, replication client on *.* to 'repl'@'192.168.116.%' identified by "123456";
flush privileges;
flush tables with read lock; /* 注意该参数设置后,如果自己同步对方数据,同步前一定要记得先解锁!*/
show master status;

结果如下:

show master status;
+-----------------+----------+--------------+------------------+------------------------------------------+
| File            | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set                        |
+-----------------+----------+--------------+------------------+------------------------------------------+
| mybinlog.000115 |     150 |              | mysql,performance_schema,informantion_schema,sys           |  |
+-----------------+----------+--------------+------------------+------------------------------------------+
1 row in set (0.00 sec)

Master1 同步 Master2

在master1(138)上做以下操作,注意master_host输入master2地址,以及master2的show master status信息:

mysql -uroot -p'123456'
unlock tables; /*先解锁,将对方数据同步到自己的数据库中*/
stop slave;
change master to master_host='192.168.116.139', master_user='repl', master_password='123456', master_log_file='mybinlog.000115', master_log_pos=150;
start slave;

查看同步状态,如下出现两个“Yes”,表明同步成功:

show slave status\G
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes

Master2 同步 Master1

在master2(139)上做以下操作,注意master_host输入master1地址,以及master1的show master status信息:

mysql -uroot -p'123456'
unlock tables; /*先解锁,将对方数据同步到自己的数据库中*/
stop slave;
change master to master_host='192.168.116.138', master_user='repl', master_password='123', master_log_file='mybinlog.000115', master_log_pos=150;
start slave;

查看同步状态,如下出现两个“Yes”,表明同步成功:

show slave status\G
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes

验证主主同步正常
在master1(138)上创建一个测试库lw1;创建表haha,插入一条数据,然后去master2(139)查询确认同步;
在master2(139)上创建一个测试库lw2;创建表haha2,插入一条数据,然后去master1(138)查询确认同步。

1)在master1数据库上写入新数据
mysql> unlock tables;
Query OK, 0 rows affected (0.00 sec)
  
mysql> create database lw1;
Query OK, 1 row affected (0.01 sec)
  
mysql> use lw1;
Database changed
  
mysql> create table if not exists haha ( id int(10) PRIMARY KEY AUTO_INCREMENT, name varchar(50) NOT NULL);
Query OK, 0 rows affected (0.04 sec)

mysql> insert into haha values(2,'guojing');
Query OK, 1 row affected (0.00 sec)

mysql> insert into haha values(1,"huangrong");
Query OK, 1 row affected (0.00 sec)

mysql> select * from haha;
+----+-----------+
| id | name |
+----+-----------+
| 1 | huangrong |
| 2 | guojing |
+----+-----------+
2 rows in set (0.00 sec)


  
然后在master2数据库上查看,发现数据已经同步过来了!
mysql> select * from lw1.haha;
+----+-----------+
| id | name |
+----+-----------+
| 1 | huangrong |
| 2 | guojing |
+----+-----------+
2 rows in set (0.00 sec)

六、Keepalived安装部署

安装keepalived软件
需要准备的系统依赖包:

gcc
libnl-1.1.4-2.el6.x86_64
libnl-devel-1.1.4-2.el6.x86_64
libnfnetlink-1.0.0-1.el6.x86_64
libnfnetlink-devel-1.0.0-1.el6.x86_64
openssl-devel-1.0.1e-58.el6_10.x86_64

配置好yum源,使用yum install安装对应的包。

yum install gcc libnl libnl-devel libnfnetlink libnfnetlink-devel openssl-devel

编译安装keepalived
解压及配置:

tar -xvf keepalived-2.0.20.tar.gz
mv keepalived-2.0.20 /usr/local/src/
cd /usr/local/src/keepalived-2.0.20
./configure --prefix=/usr/local/keepalived

编译安装:

make && make install

配置keepalived服务

配置服务文件

mkdir /etc/keepalived
cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf
cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/
cp /usr/local/keepalived/sbin/keepalived /usr/sbin
cp /usr/local/src/keepalived-2.0.20/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/keepalived

加keepalived服务

chkconfig --list |grep keepalived
chkconfig --add keepalived
chkconfig keepalived on

配置keepalived日志

keepalived的日志默认是输出到/var/log/messages中,这样不便于查看。如何自定义keepalived的日志输出文件呢?
如果是用service启动的,修改/etc/sysconfig/keepalived文件
vi /etc/sysconfig/keepalived

KEEPALIVED_OPTIONS="-D -d -S 0"

如果不是,则启动的时候指定以上参数,如:

/usr/local/keepalived/sbin/keepalived -d -D -S 0

修改/etc/syslog.conf(RHEL6.8以后配置/etc/rsyslog.conf)

# keepalived -S 0 
local0.*     /var/log/keepalived.log

重启syslog:

# RHEL 5&6:
service syslog restart
# RHEL 7:
service rsyslog restart

注:RHEL6.8也是按照RHEL7的方法来操作。

 

配置keepalived的MySQL故障转移
master1(138)机器上的keepalived.conf配置:
注:下面配置中没有使用lvs的负载均衡功能,所以不需要配置虚拟服务器virtual server

cd /etc/keepalived/
mv keepalived.conf keepalived.conf.bak
vi /etc/keepalived/keepalived.conf
! Configuration File for keepalived

vrrp_script chk_mysql_port { 
    script "/etc/keepalived/check_mysql.sh" 
    interval 2 
    weight -5 
    fall 2 
    rise 1 
}
       
vrrp_instance VI_1 {
    state MASTER    
    interface ens33 #指定虚拟ip的网卡接口
    mcast_src_ip 192.168.116.138 #指定本服务器物理ip地址
    virtual_router_id 130 #路由器标识,MASTER和BACKUP必须是一致的,取值1-255,注意同一内网中不应有相同virtual_router_id的集群,可以考虑使用vip的最后一位进行标示。
    priority 101 
    advert_int 1         
    authentication {   
        auth_type PASS 
        auth_pass 888888   
    }
    virtual_ipaddress {    
        192.168.116.130 #指定虚拟ip地址
    }
      
track_script {               
   chk_mysql_port             
}
}

编辑 /etc/keepalived/check_mysql.sh
vi /etc/keepalived/check_mysql.sh

#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
    /etc/init.d/keepalived stop
fi
 
# 修改chk_mysql.sh权限
chmod 755 /etc/keepalived/check_mysql.sh

# 启动keepalived
# service keepalived start
Starting keepalived: [ OK ]


master2(139)机器上的keepalived.conf配置:

cd /etc/keepalived/
mv keepalived.conf keepalived.conf.bak
vi /etc/keepalived/keepalived.conf

! Configuration File for keepalived

vrrp_script chk_mysql_port {
    script "/etc/keepalived/check_mysql.sh"
    interval 2            
    weight -5                 
    fall 2                 
    rise 1               
}
       
vrrp_instance VI_1 {
    state BACKUP
    interface ens33    
    mcast_src_ip 192.168.116.139
    virtual_router_id 130  
    priority 99          
    advert_int 1         
    authentication {   
        auth_type PASS 
        auth_pass 888888    
    }
    virtual_ipaddress {    
        192.168.116.130
    }
      
track_script {               
   chk_mysql_port             
}
}
 

编辑check_mysql.sh

vi /etc/keepalived/check_mysql.sh

#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
    /etc/init.d/keepalived stop
fi
chmod 755 /etc/keepalived/check_mysql.sh

启动keepalived:

service keepalived start
Starting keepalived: [ OK ]

查看keepalived日志:

tail -200f /var/log/keepalived.log

创建数据库、用户并赋权

--创建业务用户:
create user 'admin'@'%' identified by '123456';

--赋予业务用户权限(默认):
grant insert,update,delete,select,alter,create,index,SHOW VIEW on lw1.* to 'admin'@'%';

此时应用侧已经可以使用命令mysql -uadmin -p -h192.168.1.130或者客户端连接工具,登录到数据库进行相关操作了。

mysql -uadmin -p -h192.168.116.130

七、Mysql+keepalived故障转移的高可用测试

停止master1机器上的mysql服务,根据配置中的脚本,mysql服务停了,keepalived也会停,从而vip资源将会切换到master2机器上。(mysql服务没有起来的时候,keepalived服务也无法顺利启动!)

再次启动master1的mysql和keepalived服务。(注意:如果restart重启mysql,那么还要启动下keepalived,因为mysql重启,根据脚本会造成keepalived关闭)

 

注意:一定要先启动mysql服务,然后再启动keepalived服务。如果先启动keepalived服务,按照上面的配置,mysql没有起来,就会自动关闭keepalived。

 

八、Keepalived的抢占和非抢占模式

keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。

VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。

控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。

一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。

keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。

1)抢占模式:

主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。

也就是说,工作在抢占模式下,不分主备,只管优先级。

如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。

priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!!

2)非抢占模式:

这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。

并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。

千万注意:

nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!

也就是说:

a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式!

b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。

c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。即使优先级高的那一台机器恢复 后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。

 

九、mysql状态检测脚本优化

上面的mysql监测脚本有点过于简单且粗暴,即脚本一旦监测到Master的mysql服务关闭,就立刻把keepalived服务关闭,从而实现vip转移!


下面对该脚本进行优化,优化后,当监测到Master的mysql服务关闭后,就会将vip切换到Backup上(但此时Master的keepalived服务不会被暴力kill)
当Master的mysql服务恢复后,就会再次将VIP资源切回来!

#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=root
MYSQL_PASSWORD=1qaz@WSX
CHECK_TIME=3
  
#mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
  
MYSQL_OK=1
  
function check_mysql_helth (){
    $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
    if [ $? = 0 ] ;then
    MYSQL_OK=1
    else
    MYSQL_OK=0
    fi
    return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
    let "CHECK_TIME -= 1"
    check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
    CHECK_TIME=0
    exit 0
fi
if [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ]
then
    pkill keepalived
    exit 1
fi
sleep 1
done