Keepalived介绍

    • keepalived 免费开源,具备第3、4、7层交换机的功能
    • 主要提供 loadbalancing(负载均衡)和 high-availability(高可用)功能
    • 负载均衡实现需要依赖Linux的虚拟服务内核模块(ipvs)
    • 高可用是通过VRRP协议实现多台机器之间的故障转移服务
    • 采用多进程的设计模式,每个进程负责不同的功能

Keepalived的功能体系结构

大致分两层结构:用户空间 user space和内核空间 kernel space

 

 

处于虚线下方的是内核空间
    • IPVS(IP虚拟服务器),用于实现网络服务的负载均衡
    • NETLINK,提供高级路由及其他相关的网络功能
处于虚线上方的是用户空间
    • WatchDog :监控子进程VRRP和healthchecker的状况
    • Checkers :负责真实服务器的健康检查healthchecking,是keepalived最主要的功能
    • VRRP Stack:负责负载均衡器之间的失败切换 FailOver
    • IPVS wrapper :用来发送设定的规则到内核 ipvs代码
    • Netlink Reflector :用来设定 vrrp 的vip地址等

VRRP( Virtual Router Redundancy Protocol )协议

    • 用于实现路由器冗余的协议
    • 解决静态路由单点故障问题
    • 通过一种竞选(election)协议来实现虚拟路由器的功能

 

IPVS( IP Virtual Server )

              Keepalived里面所有对LVS的相关操作并不直接使用ipvsadm这样的用户端程序,而是直接使用IPVS提供的函数进程操作,该代码都在check/ipwrapper.c中

 

1)先实施Master->Slave的主主同步。主主是数据双向同步,主从是数据单向同步。一般情况下,主库宕机后,需要手动将连接切换到从库上。(但是用keepalived就可以自动切换)
2)再结合Keepalived的使用,通过VIP实现Mysql双主对外连接的统一接口。即客户端通过Vip连接数据库;当其中一台宕机后,VIP会漂移到另一台上,这个过程对于客户端的数据连接来说几乎无感觉,从而实现高可用。

MySQL主从与双主搭建请参考:http://www.cnblogs.com/wade-lt/p/9008058.html


环境描述:
mysql的安装可以参考:http://www.cnblogs.com/kevingrace/p/6109679.html
Centos7.4版本
Master:192.168.0.103        安装mysql和keepalived
Slave : 192.168.0.104        安装mysql和keepalived
VIP:192.168.0.102
    
要实现主主同步,可以先实现主从同步,即master1->master2的主从同步,然后master2->master1的主从同步.
这样,双方就完成了主主同步。
 
    
       配置Mysql+Keepalived故障转移的高可用环境
 
1)安装keepalived并将其配置成系统服务。master和salve两台机器上同样进行如下操作:
[root@master ~]# yum install -y openssl-devel        #安装依赖
[root@master ~]# cd /tmp
[root@master src]# tar -zvxf keepalived-1.4.3.tar.gz   #官网下载并上传至服务器:http://www.keepalived.org/software/(官网)
[root@master src]# cd keepalived-1.4.3
[root@master keepalived-1.4.3]# ./configure --prefix=/usr/local/keepalived
[root@master keepalived-1.4.3]# make && make install
     
[root@master keepalived-1.4.3]# cp /usr/local/src/keepalived-1.4.3/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/
[root@master keepalived-1.4.3]# cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/
[root@master keepalived-1.4.3]# mkdir /etc/keepalived/
[root@master keepalived-1.4.3]# cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/
[root@master keepalived-1.4.3]# cp /usr/local/keepalived/sbin/keepalived /usr/sbin/
[root@master keepalived-1.4.3]# echo "/etc/init.d/keepalived start" >> /etc/rc.local   #centos 7 /etc/rc.local ---> /etc/rc.d/rc.local 未能开启自启,修改文件


2)配置master机器上的keepalived.conf配置。(下面配置中没有使用lvs的负载均衡功能,所以不需要配置虚拟服务器virtual server)
注:keepalive.conf文件不能添加多余的字符如“#”注释等,“{}”与标识之间要空一个字符,keepalive.conf详解参考:https://www.cnblogs.com/along1226/p/5027838.html

[root@master ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@master ~]# vim /etc/keepalived/keepalived.conf       #清空默认内容,直接采用下面配置:    
! Configuration File for keepalived

global_defs {
   notification_email {   #指定keepalived在发生切换时需要发送email到的对象,一行一个
     acassen@firewall.loc
     failover@firewall.loc
     sysadmin@firewall.loc
   }
   notification_email_from Alexandre.Cassen@firewall.loc  #指定发件人
   smtp_server 127.0.0.1     #指定smtp服务器地址
   smtp_connect_timeout 30    #指定smtp连接超时时间
   router_id MASTER-HA       #运行keepalived机器的一个标识
}

vrrp_script chk_mysql_port {      #检测mysql服务是否在运行。有很多方式,比如进程,用脚本检测等等
    script "/opt/chk_mysql.sh"   #这里通过脚本监测
    interval 2           #脚本执行间隔,每2s检测一次
    weight -5           #脚本结果导致的优先级变更,检测失败(脚本返回非0)则优先级 -5
    fall 2             #检测连续2次失败才算确定是真失败。会用weight减少优先级(1-255之间
    rise 1             #检测1次成功就算成功。但不修改优先级
}

vrrp_instance VI_1 {
    state MASTER            #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备由priority决定
    interface ens33           #设置实例绑定的网卡
    mcast_src_ip 192.168.0.103      #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip
    virtual_router_id 51         #路由器标识,MASTER和BACKUP必须是一致的
    priority 101             #定义优先级,数字越大,优先级越高,在同一个vrrp_instance下,MASTER的优先级必须大于BACKUP的优先级。这样MASTER故障恢复后,就可以将VIP资源再次抢回来
    advert_int 1             #检查间隔,默认1秒
    authentication {#设置认证
        auth_type PASS #认证方式
        auth_pass 1111 #认证密码
    }
    virtual_ipaddress {#设置vip
        192.168.0.102/24         #与绑定的网卡实ip掩码相同
    }
    track_script {  #mysql脚本检测
        chk_mysql_port
    }
}

 

3)编写切换脚本。KeepAlived做心跳检测,如果Master的MySQL服务挂了(3306端口挂了),那么它就会选择自杀。Slave的KeepAlived通过心跳检测发现这个情况,就会将VIP的请求接管
[root@master ~]# vim /opt/chk_mysql.sh
#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
    /etc/init.d/keepalived stop
fi
 
[root@master ~]# chmod 755 /opt/chk_mysql.sh
     
启动keepalived服务
[root@master ~]# /etc/init.d/keepalived start
正在启动 keepalived:                                      [确定]
    

4)slave机器上的keepalived配置。slave机器上的keepalived.conf文件只修改priority为99、nopreempt不设置、real_server设置本地IP。

[root@slave ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak

[root@slave ~]# vim /etc/keepalived/keepalived.conf
! Configuration File for keepalived

global_defs {
   notification_email {
     acassen@firewall.loc
     failover@firewall.loc
     sysadmin@firewall.loc
   }
   notification_email_from Alexandre.Cassen@firewall.loc
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id MASTER-HA
}

vrrp_script chk_mysql_port {
    script "/opt/chk_mysql.sh"
    interval 2
    weight -5
    fall 2
    rise 1
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    mcast_src_ip 192.168.0.104
    virtual_router_id 51
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        192.168.0.102/24
    }
    track_script {
        chk_mysql_port
    }
   
}

     
[root@slave ~]# cat /opt/chk_mysql.sh
#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
    /etc/init.d/keepalived stop
fi
 
[root@slave ~]# chmod 755 /opt/chk_mysql.sh
     
[root@slave ~]# /etc/init.d/keepalived start
正在启动 keepalived:                                      [确定]

注:如有防火墙,请开放相关权限,如:两台主机之间的通信,vrrp通信以及mysql的3306端口,关闭selinux /etc/selinux/conf ,修改后并使之生效

Mysql+keepalived故障转移的高可用测试

1)通过Mysql客户端通过VIP连接,看是否连接成功。
比如,在远程一台测试机上连接,通过vip地址可以正常连接(下面的连接权限要是在服务端提前授权的)
[root@dev-new-test ~]# mysql -h192.168.0.103 -uroot -p123456

2)默认情况下,vip是在master上的。使用"ip a"命令查看vip切换情况
[root@master ~]# ip a

停止master机器上的mysql服务,根据配置中的脚本,mysql服务停了,keepalived也会停,从而vip资源将会切换到slave机器上。(mysql服务没有起来的时候,keepalived服务也无法顺利启动!)
[root@master ~]# /etc/init.d/mysql stop
Shutting down MySQL.. SUCCESS!
[root@master ~]# ps -ef|grep mysql
root     25812 21588  0 17:30 pts/0    00:00:00 grep mysql
[root@master ~]# ps -ef|grep keepalived
root     25814 21588  0 17:30 pts/0    00:00:00 grep keepalived
[root@master ~]# ip addr                  
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:3c:25:42 brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.103/24 brd 192.168.0.255 scope global ens33
    inet6 fe80::5054:ff:fe3c:2542/64 scope link
       valid_lft forever preferred_lft forever
 
如上结果,发现vip没有了,说明此时vip资源已不在master机器上了
查看下master的系统日志,如下,会发现vip资源已经切换走了
[root@master ~]# tail -f /var/log/messages

 

再到slave机器上,发现vip资源的确切换过来了
[root@slave ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:95:1f:6d brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.104/24 brd 192.168.0.255 scope global ens33
    inet 192.168.0.102/24 scope global ens33
    inet6 fe80::5054:ff:fe95:1f6d/64 scope link
       valid_lft forever preferred_lft forever
 查看slave的系统日志
[root@slave ~]# tail -f /var/log/messages

3)再次启动master的mysql和keepalived服务。(注意:如果restart重启mysql,那么还要启动下keepalived,因为mysql重启,根据脚本会造成keepalived关闭)
注意:一定要先启动mysql服务,然后再启动keepalived服务。如果先启动keepalived服务,按照上面的配置,mysql没有起来,就会自动关闭keepalived。
[root@master ~]# /etc/init.d/mysql start
Starting MySQL.. SUCCESS!
 
[root@master ~]# /etc/init.d/keepalived start
正在启动 keepalived:                                      [确定]
 
启动这两个服务器后,稍微等过一会儿,注意观察会发现vip资源再次从slave机器上切换回来了。
[root@master ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:3c:25:42 brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.103/24 brd 192.168.0.255 scope global ens33
    inet 192.168.0.102/24 scope global ens33
    inet6 fe80::5054:ff:fe3c:2542/64 scope link
       valid_lft forever preferred_lft forever
 
[root@master ~]# tail -f /var/log/messages

再看看slave机器,发现vip资源又被恢复后的master抢过去了
[root@slave ~]# ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 52:54:00:95:1f:6d brd ff:ff:ff:ff:ff:ff
    inet 192.168.0.104/24 brd 192.168.0.255 scope global ens33
    inet6 fe80::5054:ff:fe95:1f6d/64 scope link
       valid_lft forever preferred_lft forever
 
[root@slave ~]# tail -f /var/log/messages

4)同样,关闭master1机器的keepalived服务,vip资源会自动切换到master2机器上。当master1的keepalived服务恢复后,会将vip资源再次切回来。


以上在vip资源切换过程中,对于客户端连接mysql(使用vip连接)来说几乎是没有任何影响的。


------------------------------------温馨提示(Keepalived的抢占和非抢占模式)---------------------------------------
keepalive是基于vrrp协议在linux主机上以守护进程方式,根据配置文件实现健康检查。
VRRP是一种选择协议,它可以把一个虚拟路由器的责任动态分配到局域网上的VRRP路由器中的一台。
控制虚拟路由器IP地址的VRRP路由器称为主路由器,它负责转发数据包到这些虚拟IP地址。
一旦主路由器不可用,这种选择过程就提供了动态的故障转移机制,这就允许虚拟路由器的IP地址可以作为终端主机的默认第一跳路由器。
 
keepalive通过组播,单播等方式(自定义),实现keepalive主备推选。工作模式分为抢占和非抢占(通过参数nopreempt来控制)。
1)抢占模式:
主服务正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不提供服务,备提供服务。
也就是说,工作在抢占模式下,不分主备,只管优先级。
 
如上配置,不管keepalived.conf里的state配置成master还是backup,只看谁的priority优先级高(一般而言,state为MASTER的优先级要高于BACKUP)。
priority优先级高的那一个在故障恢复后,会自动将VIP资源再次抢占回来!!
 
2)非抢占模式:
这种方式通过参数nopreempt(一般设置在advert_int的那一行下面)来控制。不管priority优先级,只要MASTER机器发生故障,VIP资源就会被切换到BACKUP上。
并且当MASTER机器恢复后,也不会去将VIP资源抢占回来,直至BACKUP机器发生故障时,才能自动切换回来。
 
千万注意:
nopreempt这个参数只能用于state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!
 
也就是说:
a)当state状态一个为master,一个为backup的时候,加不加nopreempt这个参数都是一样的效果。即都是根据priority优先级来决定谁抢占vip资源的,是抢占模式!
b)当state状态都设置成backup,如果不配置nopreempt参数,那么也是看priority优先级决定谁抢占vip资源,即也是抢占模式。
c)当state状态都设置成backup,如果配置nopreempt参数,那么就不会去考虑priority优先级了,是非抢占模式!即只有vip当前所在机器发生故障,另一台机器才能接管vip。
  即使优先级高的那一台机器恢复  后也不会主动抢回vip,只能等到对方发生故障,才会将vip切回来。

---------------------------------mysql状态检测脚本优化---------------------------------
案例一:
上面的mysql监测脚本有点过于简单且粗暴,即脚本一旦监测到Master的mysql服务关闭,就立刻把keepalived服务关闭,从而实现vip转移!
 
下面对该脚本进行优化,优化后,当监测到Master的mysql服务关闭后,就会将vip切换到Backup上(但此时Master的keepalived服务不会被暴力kill)
当Master的mysql服务恢复后,就会再次将VIP资源切回来!
 
[root@master ~]# cat /opt/chk_mysql.sh
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=root
MYSQL_PASSWORD=root
CHECK_TIME=3
 
#mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
 
MYSQL_OK=1
 
function check_mysql_helth (){
    $MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
    if [ $? = 0 ] ;then
    MYSQL_OK=1
    else
    MYSQL_OK=0
    fi
    return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
    let "CHECK_TIME -= 1"
    check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
    CHECK_TIME=0
    exit 0
fi
if [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ]
then
    pkill keepalived
    exit 1
fi
sleep 1
done

 

案例二:

[root@master opt]# cat chk_mysql.sh
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=root
MYSQL_PASSWORD=root
CHECK_TIME=3
#mysql  is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
MYSQL_OK=1
VIP=192.168.0.102
function check_mysql_helth ()
{
     $MYSQL  -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
     if [ $? -eq 0 ] ;then
            MYSQL_OK=1
     else
            MYSQL_OK=0
        fi
     return $MYSQL_OK  
}

while [ $CHECK_TIME -ne 0 ]
do
     let "CHECK_TIME -= 1"    
     check_mysql_helth  
   if [ $MYSQL_OK = 1 ] ; then
      CHECK_TIME=0
      exit 0
  fi

  ip a|grep $VIP
  if [ $? -eq 0 ] && [ $CHECK_TIME -eq 0 ];then
      mount /dev/mapper/mpathb /opt/diskarray
      echo "vip is here,mysql is down"
      service mysqll restart
 
     if [ $? -ne  0 ];then
       echo "vip is here,but mysql is not work !"
       /etc/init.d/keepalived restart
       umount /dev/mapper/mpathb
       exit 1
     fi
       exit 3
   elif [ $MYSQL_OK -eq 0 ] &&  [ $CHECK_TIME -eq 0 ];then
      echo " not vip , 2th  check  mysql is down "
      exit 5
   fi
      sleep 2
done

 

 

 

posted on 2018-05-09 15:33  wade_lt  阅读(468)  评论(0编辑  收藏  举报