(5.16)mysql高可用系列——keepalived+mysql双主ha
【1】KeepAlived的基本概念与原理
双主KeepAlived
利用KeepAlived实现故障转移(功能上类似于MSSQL的镜像,形式上类似于windows的故障转移群集)
更高级的架构如下:
keepalived架在双主上,双主互为主从,多个从库连接keepalived的VIP。外部使用mycat做读写分离与读负载均衡
【1.1】keepalived 简介
参考:(5.1)mysql高可用系列——高可用架构方案概述 中的【4】双主keepalive
(1.1.1)Keepalived服务的工作原理
Keepalived服务对之间通过VRRP进行通信的,VRRP是通过竞选机制来确定主备的(有点像故障转移群集中的投票仲裁形式),主的优先级高于备,因此工作时主会优先获得所有的资源,备节点处于等待状态,当主挂了的时候,备节点就会接管主节点的资源,然后顶替主节点对外服务。
在Keepalived服务对之间,只有作为主的服务器会一直发送VRRP广播包,告诉备它还活着,此时备不会抢占主,当主不可用(也就是备没有受到VRRP广播包信息),就会启动相关服务接管资源,保证业务的连续性,接管速度最快可以小于1秒。
(1.1.2)keepalived 的三个核心模块
分别是core/check/vrrp
core:keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。
check:负责健康检查,包括常见的各种检查方式。
vrrp:是用来实现VRRP协议的;(VRRP:全称 virtual router redundancy protocol,虚拟路由冗余协议)
(1.1.3)什么是VRRP?
VRRP,全称 virtual router redundancy protocol,虚拟路由冗余协议。
VRRP的出现就是为了解决静态路由的单点故障问题,VRRP是通过一种竞选机制来将路由的任务交给某台VRRP路由器的。
Keepalived通过组播(默认)、单播(自定义),实现keepalived主备推选,工作模式分为抢占和非抢占。
《1》抢占模式
主服务器正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不供服务,备提供服务。
也就是说,抢占模式下,不分主备,只管优先级。
不管 keepalived.conf 里的 state 配置成 master 还是 backup ,只看谁的priority 优先级高, priority 优先级高的那一个,在故障恢复后,会自动将VIP资源再次抢回来。
举例:
1)俩台都为master/backup时,比如server1的优先级大于server2,keepalived启动后server1获得master,server2自动降级为backup。
此时server1宕机的话,server2接替 服务,当server1恢复后,server1又变为master,重新接管服务,server2变为backup。属于抢占式。
2) server1为master,server2位backup,且master优先级大于backup。keepalived启动后server1获得master,server2为backup。
当server1宕机后, server2接管服务。当server1恢复后,server1重新接管服务变为master,而server2变为backup。属于抢占式
3) server1为master,server2位backup,且master优先级低于backup。keepalived启动后server2获得master,server1为backup。
当server2宕机后, server1接管服务。此时server2恢复后抢占服务,获得master,server1降级将为backup。属于抢占式
《2》非抢占模式
这种方式通过参数nopreempt(一般设置在advert_int 的那一行下面)来控制。不管priority优先级,只要master机器发生故障,VIP资源就会被切换到backup上。
并且,当master机器恢复后,也不会将VIP资源抢回来。除非Backup机器发生故障,才能自动把VIP等资源切换会主库。
nopreempt 这个参数只能用户state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!
也就是说
d) 当state状态都为master或者都为backup的时候,没有加nopreempt参数,那么
a)当state状态一个为master,一个为backup的时候,加不加nopreempt 这个参数都是一样的效果。
即都是根据priority优先级来决定谁抢占VIP资源,属于抢占模式!
b)当state状态都设置成backup,如果不配置nopreempt参数。
也是根据priority优先级来决定谁抢占VIP资源,属于抢占模式!
c)当state状态都设置成backup,如果配置了 nopreempt 参数,那么久不会去考虑priority优先级了。
是非抢占模式! 即只有VIP当前所在机器发生故障,另一台机器才能接管VIP。 不考虑优先级问题。
注意:这样配置后,我们要注意启动服务的顺序,优先启动的获取master权限,与优先级没有关系了
【1.2】Keepalived在MySQL上有什么作用?
mysql双主复制,即互为Master-Slave(只有一个Master提供写操作),可以实现数据库服务器的热备。
但一个Master宕机后不能实现动态切换,使用Keepalived,可以通过虚拟IP,实现双主对外的统一接口以及自动检查、失败切换机制,从而实现MySQL数据库的高可用方案。
【1.3】较为详细的介绍
Keepalived是一个高度模块化设计的软件,从源代码结构似乎也很容易看出这一点。Keepalived 1.2.13源代码中只有如下目录:check core etc include libipvs-2.4 libipvs-2.6 vrrp
check:Keepalived的healthchecker子进程的目录,包括了所有的健康检查方式以及对应配置的解析,LVS的配置解析也在这个里面。
core:Keepalived的核心程序,如全局配置的解析,进程启动等等。
etc:包含Keepalived的配置模板和启动脚本等文件。
include:头文件目录。
libipvs*:LVS使用的库文件。
vrrp:Keepalived的vrrpd子进程以及相关的代码。
(1) 多进程模式
Keepalived采用了多进程的设计模式,每个进程负责不同的功能,我们在使用LVS的机器上通常可以看到三个Keepalived进程:
111 keepalived < 父进程,负责内存管理、监控子进程等
112 \_ keepalived < VRRP子进程
113 \_ keepalived < healthchecker子进程
(2) 控制面板
这里所谓的控制面板就是对配置文件的编译和解析。Keepalived的配置文件解析比较另类,并不是一次解析所有配置,而是只在用到某模块时才解析相应的配置。在源文件里面可以看到类似XXX_parser.c的文件,就是做这个用的。
(3) 看门狗
WatchDog框架提供了对VRRP和healthchecker子进程的监控。
(4)IPVS封装
Keepalived里面所有对LVS的相关操作并不直接使用ipvsadm客户端程序,而是使用IPVS提供的函数进行操作,这些代码都在check/ipwrapper.c中。
【2】环境与架构准备
【2.1】实验基本配置情况
操作系统:CentOS7.5
mysql:5.7.24
Mysql master DB3: 192.168.135.173
Mysql slave DB4: 192.168.135.174
keepalived:https://www.keepalived.org/software/keepalived-1.3.3.tar.gz
先搭建好mysql主从,这里略
【2.2】操作系统环境配置(防火墙)
#(1)添加非本机IP绑定支持 echo "net.ipv4.ip_nonlocal_bind=1" >> /etc/sysctl.conf sysctl -p #(2)配置iptables,添加VRRP通讯支持 -A INPUT -d 224.0.0.18 -j ACCEPT #允许组播地址访问本机,组播地址用于keepalived互相检测心跳
-A INPUT -s 192.168.1.0/24 -d 224.0.0.18 -j ACCEPT #允许组播地址通信
-A INPUT -s 192.168.1.0/24 -p vrrp -j ACCEPT #允许VRRP(虚拟路由器冗余协议)通信
-A INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCPET #开发mysql3306端口
firewalld防火墙
firewall-cmd --permanent --add-protocol=vrrp
firewall-cmd --reload
#(3)开启路由转发功能
#临时
echo "1">/proc/sys/net/ipv4/ip_forward
#永久
echo "net.ipv4.ip_forward=1" >> /etc/sysctl.conf
sysctl -p
【2.3】下载、安装 keepalived
#(1)下载
官网:https://www.keepalived.org/download.html
wget https://www.keepalived.org/software/keepalived-1.3.3.tar.gz
#(2)安装前置依赖包
mount /dev/cdrom /mnt #加载本地源,有网络直接配置也可(参考:yum源配置、epel源配置)
yum install kernel-devel openssl-devel popt-devel -y
#(3)安装
cd /soft/
tar -zxvf keepalived-1.3.3.tar.gz
cd keepalived-1.3.4
./configure --prefix=/usr/local/keepalived/
make && make install
#(4)设置keepalived开机自启
systemctl enable keepalived
------------下面(5)(6)可以忽略------------------------
#(5)如果不设置自定义目录,默认目录如下
#cp /usr/local/etc/rc.d/init.d/keepalived /etc/rc.d/init.d/
#cp /usr/local/etc/sysconfig/keepalived /etc/sysconfig/
#mkdir /etc/keepalived
#cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived/
#cp /usr/local/sbin/keepalived /usr/sbin/
#(5)构建keepalived 配置文件目录与文件
mkdir /etc/keepalived
cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/
#(6)基本配置文件复制
cp usr/local/keepalived/sbin/keepalived /usr/sbin/
cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/
【2.4】配置文件解析
参考:https://blog.csdn.net/shmnh/article/details/42000615
vim /usr/local/keepalived/etc/keepalived/keepalived.conf
! Configuration File for keepalived global_defs { #全局定义, notification_email {#邮件通知,下面的是收件人邮件地址,需要开启sendmail服务 acassen@firewall.loc failover@firewall.loc sysadmin@firewall.loc } notification_email_from Alexandre.Cassen@firewall.loc #邮件通知的发件人地址 smtp_server 192.168.200.1 #发送邮件服务器地址 smtp_connect_timeout 30 #连接邮件服务器超时时间-秒 router_id LVS_DEVEL #路由id,随便取名字但同一个连接网络要唯一 vrrp_skip_check_adv_addr vrrp_strict vrrp_garp_interval 0 vrrp_gna_interval 0 } vrrp_instance VI_1 {#配置虚拟实例,这个名字任意取 state MASTER #角色状态,可以是 MASTER/BACKUP,具体情况见 1.1.3下标红字体 interface eth0 #指定HA检测网络的接口 virtual_router_id 51 #路由id priority 100 #优先级 advert_int 1 #广播频率,单位是秒
#nopreempt #默认抢占模式,这个参数设置非抢占模式,需要主从state 都为BACKUP 才生效 authentication {#身份验证 auth_type PASS #验证类型 PASS为密码验证 auth_pass 1111 #验证密码,主从一样就好了 } virtual_ipaddress {#虚拟IP,我们启动后虚拟IP是多少 192.168.200.16 #192.168.1.210/24 192.168.200.17 192.168.200.18 } } virtual_server 192.168.200.100 443 {#虚拟服务器,IP+端口,以空格分隔 delay_loop 6 #运行情况检查,IP+端口是否可用,单位是秒 lb_algo rr #设置负载调度算法,这里设置rr,即轮询算法 lb_kind NAT #设置LVS实现负载均衡机制,有NAT、TUN、DR(直接路由)三个模式可选 persistence_timeout 50 #会话保持单位时间,单位是秒 protocol TCP #指定转发协议类型,有TCP和UDP两种 real_server 192.168.201.100 443 {#虚拟服务器对应的实际服务器、端口 weight 1 #配置服务节点的权值,权值数字越大,权值越高 SSL_GET {#获取ssl连接信息 url { path / digest ff20ad2481f97b1754ef3e12ecd3a9cc } url { path /mrtg/ digest 9b3a0c85a887a256d6939da88aabd8cd }
#notify_down /etc/keepalived/keepalived_stop.sh #如果这个server down掉之后这个服务器执行的内容
#notify_master /home/mysql/master.sh #如果这个server down掉之后,新主服务器执行这个脚本 connect_timeout 3 #tcp检测参数,表示3秒无响应超时 retry 3 #表示最大重试次数 delay_before_retry 3 #表示重试间隔秒数
#connect_port 3306 #表示连接检测的端口为3306 } } }
#后面一样的就不赘述了。
【2.5】最佳实践配置文件
参考代码:
global_defs {#全局定义 router_id MySQL-HA #全局路由ID,主从需要相同 } vrrp_script check_run {#VRRP自定义脚本,check_run自定义名称 script "/etc/keepalived/mysql_check.sh" #调用的脚本文件URL interval 60 #运行间隔,单位为秒 } vrrp_sync_group VG1 {#vrrp同步组,VG1是自定义名称 group {#组内成员 VI_1 } } vrrp_instance VI_1 {#vrrp虚拟实例 state BACKUP #从 interface ens34 #针对监听的网络接口 virtual_router_id 51 #唯一路由ID,主从要一致 priority 90 #权限 advert_int 1 #广播频率,单位是秒 nopreempt #非抢占模式 authentication {#同一组keepalived的验证方式 auth_type PASS auth_pass 1234 } track_script {#定义跟踪使用脚本 check_run #这里就是我们上面自己定义的脚本
}
notify_master /etc/keepalived/master.sh #当本机换为Master状态时,会呼叫执行 notify_master
notify_stop /etc/keepalived/stop.sh #当本机终止keepalived 时,会呼叫执行 notify_stop
notify_backup /etc/keepalived/backup.sh #当本机进入Backup状态时,会呼叫执行 notify_backup
notify_fault /etc/keepalived/fault.sh #当本机发现异常情况进入Fault状态时,会呼叫执行 notify_fault
virtual_ipaddress { #设置虚拟IP
192.168.1.210
}
}
单播参考:
unicast_src_ip 192.168.1.14 # 配置单播的本机地址 unicast_peer { 192.168.1.15 #配置单播的目标地址 } #keepalived在组播模式下所有的信息都会向224.0.0.18的组播地址发送,产生众多的无用信息,并且会产生干扰和冲突,可以将组播的模式改为单拨。也有可能组播被上级禁用。这是一种安全的方法,避免局域网内有大量的keepalived造成虚拟路由id的冲突。
我的实际代码:
#主 global_defs { router_id MySQL-HA } vrrp_script check_run { script "/etc/keepalived/mysql_check.sh" interval 60 } vrrp_sync_group VG1 { group { VI_1 } } vrrp_instance VI_1 { state BACKUP interface ens33 virtual_router_id 51 priority 100 advert_int 1 nopreempt authentication { auth_type PASS auth_pass 1234 } track_script {
check_run } notify_master /etc/keepalived/master.sh notify_stop /etc/keepalived/stop.sh virtual_ipaddress { 192.168.135.180 } } #从 global_defs { router_id MySQL-HA } vrrp_script check_run { script "/etc/keepalived/mysql_check.sh" interval 60 } vrrp_sync_group VG1 { group { VI_1 } } vrrp_instance VI_1 { state BACKUP interface ens33 virtual_router_id 51 priority 90 advert_int 1 nopreempt authentication { auth_type PASS auth_pass 1234 } track_script {
check_run } notify_master /etc/keepalived/master.sh notify_stop /etc/keepalived/stop.sh virtual_ipaddress { 192.168.135.180 } }
/etc/keepalived/mysql_check.sh的作用是为了没分钟判断一次mysql服务是否存活
#!/bin/bash
source /etc/profile count=1 while true do
mysql -uroot -p123456 -S /tmp/mysql_3306.sock -e "show status;" > /dev/null 2>&1 i=$? ps aux | grep mysqld | grep -v grep > /dev/null 2>&1 j=$? if [ $i = 0 ] && [ $j = 0 ] then exit 0 else if [ $i = 1 ] && [ $j = 0 ] then exit 0 else if [ $count -gt 5 ] then break fi count=$((${count}+1)) continue fi fi done systemctl stop keepalived
other
#!/bin/bash count=1 while true do ps aux | grep mysqld | grep -v grep > /dev/null 2>&1 j=$? if [ $j = 0 ] then exit 0 else sleep 1 if [ $count -gt 5 ] then break fi count=$((${count}+1)) continue fi done systemctl stop keepalived
/etc/keepalived/master.sh 的作用是状态改为master以后执行的脚本。
首先判断复制是否有延迟,如果有延迟,等1分钟后,不论是否有延迟,都并停止复制,并且记录binlog和pos点。文件内容如下。
#!/bin/bash
source /etc/profile Master_Log_File=$(mysql -uroot -S /tmp/mysql_3306.sock -e "show slave status\G" | grep -w Master_Log_File | awk -F": " '{print $2}') Relay_Master_Log_File=$(mysql -uroot -S /tmp/mysql_3306.sock -e "show slave status\G" | grep -w Relay_Master_Log_File | awk -F": " '{print $2}') Read_Master_Log_Pos=$(mysql -uroot -S /tmp/mysql_3306.sock "show slave status\G" | grep -w Read_Master_Log_Pos | awk -F": " '{print $2}') Exec_Master_Log_Pos=$(mysql -uroot -S /tmp/mysql_3306.sock "show slave status\G" | grep -w Exec_Master_Log_Pos | awk -F": " '{print $2}') i=1 while true do if [ $Master_Log_File = $Relay_Master_Log_File ] && [ $Read_Master_Log_Pos -eq $Exec_Master_Log_Pos ] then echo "ok" break else sleep 1 if [ $i -gt 60 ] then break fi let i++ fi done mysql -uroot -S /tmp/mysql_3306.sock -e "stop slave;" mysql -uroot -S /tmp/mysql_3306.sock -e "reset slave all;" mysql -uroot -S /tmp/mysql_3306.sock -e "reset master;"
mysql -uroot -S /tmp/mysql_3306.sock -e "set global read_only=0;"
/etc/keepalived/stop.sh 主库 keepalived 停止以后需要执行的脚本。检查是否还有复制写入操作,最后无论是否执行完毕都退出。文件内容如下。
#!/bin/bash source /etc/profile M_File1=$(mysql -uroot -S /tmp/mysql_3306.sock -e "show master status\G" | awk -F': ' '/File/{print $2}') M_Position1=$(mysql -uroot -S /tmp/mysql_3306.sock -e "show master status\G" | awk -F': ' '/Position/{print $2}') sleep 1 M_File2=$(mysql -uroot -S /tmp/mysql_3306.sock -e "show master status\G" | awk -F': ' '/File/{print $2}') M_Position2=$(mysql -uroot -S /tmp/mysql_3306.sock -e "show master status\G" | awk -F': ' '/Position/{print $2}') i=1 while true do if [ $M_File1 = $M_File1 ] && [ $M_Position1 -eq $M_Position2 ] then echo "ok" break else sleep 1 if [ $i -gt 60 ] then break fi continue let i++ fi done
简单版notify.sh
#!/bin/bash contact='yuxingfu@aikosolar.com' notify(){ mailsubject="$(hostname) to be $1, vip转移" mailbody="(`date +%F%T`):vrrp transition, $(hostname) changed to be $1" echo "$mailbody" | mail -s "$mailsubject" $contact } case $1 in master) notify master ;; backup) notify backup ;; fault) notify fault ;; stop) notify fault ;; *) echo "Usage: $(basename $o) {master|backup|fault|stop}" exit 1 ;; esac
【2.6】修改默认日志文件位置
#默认错误日志位置:/var/log/messages
#(1)修改文件
vim /usr/local/keepalived/etc/sysconfig/keepalived
#左边改成右边
KEEPALIVED_OPTIONS="-D" =》 KEEPALIVED_OPTIONS="-D -d -S 0"
# --dont-release-ipvs -I Dont remove IPVS topology on daemon stop.
# --dump-conf -d Dump the configuration data.
# --log-detail -D Detailed log messages.
# --log-facility -S 0-7 Set local syslog facility (default=LOG_DAEMON)
#(2)修改日志级别参数文件
vi /etc/rsyslog.conf
#在最后一行加上
local0.* /var/log/keepalived.log
#(3)重启日志服务
systemctl restart rsyslog
【2.7】启动、查看keepalived
systemctl daemon-reload #重新装载服务 systemctl start keepalived #启动服务 systemctl enable keepalived #设置服务开机自启 systemctl status keepalived #查看服务状态,有没有报错最快可以看这里 ps -ef|grep keepalived|grep -v "grep" #查看服务进程
查看VIP所在。
【2.8】基于mysql连接的核验
用mysql连接虚拟IP地址,查看是哪个机器。
果然是DB3。
【2.9】故障转移测试
(1)查看当前运行情况,确保keepalived和mysql都在运行
(2)查看当前谁是 keepalived 的 master
很明显,现在173是 master
(3)关闭 mysql 服务模拟故障转移
由上图可以看到,我们关闭了 173(keepalived master) 机器的 mysql服务后,keepalived也跟着关闭了。
(4)故障转移查看
《1》IP地址查看
并且,我们的 master.sh 脚本 还生成了一个txt文件,它记录该机器所在 mysql 实例的 binlog 信息
《2》连接查看,我还特地搞了个 其他机器来连接 VIP,结果成功。
【3】MHA配置keepalived
【3.1】实验基本配置情况
操作系统:CentOS7.5
mysql:5.7.24
Mysql master DB1: 192.168.1.201
Mysql slave DB2: 192.168.1.202
keepalived:https://www.keepalived.org/software/keepalived-1.3.3.tar.gz
先搭建好mysql主从,这里略
【3.2】操作系统环境配置(防火墙)
#(1)添加非本机IP绑定支持
echo "net.ipv3.ip_nonlocal_bind=1" >> /etc/sysctl.conf
sysctl -p
#(2)配置iptables,添加VRRP通讯支持
-A INPUT -d 223.0.0.18 -j ACCEPT #允许组播地址访问本机
-A INPUT -s 192.168.1.0/24 -d 223.0.0.18 -j ACCEPT #允许组播地址通信
-A INPUT -s 192.168.1.0/24 -p vrrp -j ACCEPT #允许VRRP(虚拟路由器冗余协议)通信
-A INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCPET #开发mysql3306端口
#(3)开启路由转发功能
echo "1">/proc/sys/net/ipv4/ip_forward
【3.3】下载、安装 keepalived
#(1)下载
官网:https://www.keepalived.org/download.html
wget https://www.keepalived.org/software/keepalived-1.3.3.tar.gz
#(2)安装前置依赖包
mount /dev/cdrom /mnt #加载本地源,有网络直接配置也可(参考:yum源配置、epel源配置)
yum install kernel-devel openssl-devel popt-devel -y
#(3)安装
cd /soft/
tar -zxvf keepalived-1.3.3.tar.gz
cd keepalived-1.3.4
./configure --prefix=/usr/local/keepalived/
make && make install
#(4)设置keepalived开机自启
systemctl enable keepalived
#(5)如果不设置自定义目录,默认目录如下
#cp /usr/local/etc/rc.d/init.d/keepalived /etc/rc.d/init.d/
#cp /usr/local/etc/sysconfig/keepalived /etc/sysconfig/
#mkdir /etc/keepalived
#cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived/
#cp /usr/local/sbin/keepalived /usr/sbin/
#(5)构建keepalived 配置文件目录与文件
mkdir /etc/keepalived
cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/
【3.4】配置文件解析
参考:https://blog.csdn.net/shmnh/article/details/42000615
vim /usr/local/keepalived/etc/keepalived/keepalived.conf
! Configuration File for keepalived
global_defs { #全局定义,
notification_email {#邮件通知,下面的是收件人邮件地址,需要开启sendmail服务
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc #邮件通知的发件人地址
smtp_server 192.168.200.1 #发送邮件服务器地址
smtp_connect_timeout 30 #连接邮件服务器超时时间-秒
router_id LVS_DEVEL #路由id,随便取名字但同一个连接网络要唯一
vrrp_skip_check_adv_addr
vrrp_strict
vrrp_garp_interval 0
vrrp_gna_interval 0
}
vrrp_instance VI_1 {#配置虚拟实例,这个名字任意取
state MASTER #角色状态,可以是 MASTER/BACKUP,具体情况见 1.1.3下标红字体
interface eth0 #指定HA检测网络的接口
virtual_router_id 51 #路由id
priority 100 #优先级
advert_int 1
#nopreempt #默认抢占模式,这个参数设置非抢占模式,需要主从state 都为BACKUP 才生效
authentication {#身份验证
auth_type PASS #验证类型 PASS为密码验证
auth_pass 1111 #验证密码,主从一样就好了
}
virtual_ipaddress {#虚拟IP,我们启动后虚拟IP是多少
192.168.200.16 #192.168.1.210/24
192.168.200.17
192.168.200.18
}
}
virtual_server 192.168.200.100 443 {#虚拟服务器,IP+端口,以空格分隔
delay_loop 6 #运行情况检查,IP+端口是否可用,单位是秒
lb_algo rr #设置负载调度算法,这里设置rr,即轮询算法
lb_kind NAT #设置LVS实现负载均衡机制,有NAT、TUN、DR(直接路由)三个模式可选
persistence_timeout 50 #会话保持单位时间,单位是秒
protocol TCP #指定转发协议类型,有TCP和UDP两种
real_server 192.168.201.100 443 {#虚拟服务器对应的实际服务器、端口
weight 1 #配置服务节点的权值,权值数字越大,权值越高
SSL_GET {#获取ssl连接信息
url {
path /
digest ff20ad2481f97b1754ef3e12ecd3a9cc
}
url {
path /mrtg/
digest 9b3a0c85a887a256d6939da88aabd8cd
}
#notify_down /etc/keepalived/keepalived_stop.sh #如果这个server down掉之后这个服务器执行的内容
#notify_master /home/mysql/master.sh #如果这个server down掉之后,新主服务器执行这个脚本
connect_timeout 3 #tcp检测参数,表示3秒无响应超时
retry 3 #表示最大重试次数
delay_before_retry 3 #表示重试间隔秒数
#connect_port 3306 #表示连接检测的端口为3306
}
}
}
#后面一样的就不赘述了。
virtual_server 10.10.10.2 1358 {
delay_loop 6
lb_algo rr
lb_kind NAT
persistence_timeout 50
protocol TCP
sorry_server 192.168.200.200 1358
real_server 192.168.200.2 1358 {
weight 1
HTTP_GET {
url {
path /testurl/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
url {
path /testurl2/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
url {
path /testurl3/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
connect_timeout 3
retry 3
delay_before_retry 3
}
}
real_server 192.168.200.3 1358 {
weight 1
HTTP_GET {
url {
path /testurl/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334c
}
url {
path /testurl2/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334c
}
connect_timeout 3
retry 3
delay_before_retry 3
}
}
}
virtual_server 10.10.10.3 1358 {
delay_loop 3
lb_algo rr
lb_kind NAT
persistence_timeout 50
protocol TCP
real_server 192.168.200.4 1358 {
weight 1
HTTP_GET {
url {
path /testurl/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
url {
path /testurl2/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
url {
path /testurl3/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
connect_timeout 3
retry 3
delay_before_retry 3
}
}
real_server 192.168.200.5 1358 {
weight 1
HTTP_GET {
url {
path /testurl/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
url {
path /testurl2/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
url {
path /testurl3/test.jsp
digest 640205b7b0fc66c1ea91c463fac6334d
}
connect_timeout 3
retry 3
delay_before_retry 3
}
}
}
【3.5】最佳实践配置文件
参考:
global_defs {
notification_email {
xxxxxx@sina.com #设置报警邮件地址,可以设置多个,每行一个。需要开启sendmail服务。
}
notification_email_from keepalived@localhost #设置邮件的发送地址
smtp_server 127.0.0.1 #设置SMTP Server地址
smtp_connect_timeout 30 #设置SMTP Server的超时时间
router_id LVS_DEVEL #表示运行Keepalived服务器的一个标识。发邮件时显示大邮件主题中的信息
}
vrrp_instance VI_1 { #vrrp 实例定义部分
state MASTER #指定Keepalived的角色,MASTER表示些主机是主服务器。BACKUP表示此主机是备用服务器
interface eth1 #指定HA监测网络的接口
virtual_router_id 51 #虚拟路由标识,这个标识是一个数字,同一个vrrp实例使用唯一的标识,即同一个vrrp_instance下MASTER与BACKUP必须是一致的
priority 50 #定义优先级,数字越大,优先级越高
authentication {
auth_type PASS #设置验证类型和密码,MASTER和BACKUP必须使用相同的密码才能正常通信
auth_pass 1111
}
virtual_ipaddress { #设置虚拟IP地址,可以设置多个虚拟IP地址,每行一个
192.168.100.250
}
}
virtual_server 192.168.100.250 80 { #设置虚拟服务器,需要指定虚拟IP地址和服务端口,IP与端口之间用空格隔开
delay_loop 6 #设置运行情况检查时间,单位为秒
lb_algo rr #设置负载调度算法,这里设置rr,即轮询算法
lb_kind DR #设置LVS实现负载均衡机制,有NAT、TUN、DR三个模式可选
persistence_timeout 60 #会话保持单位时间,单位是秒
protocol TCP #指定转发协议类型,有TCP和UDP两种
real_server 192.168.100.60 80 { #配置服务节点1,需要指定real server的真实IP地址和端口
weight 1 #配置服务节点的权值,权值数字越大,权值越高
TCP_CHECK { #relserve的状态检测设置部分,单位是秒
connect_timeout 10 #表示10秒无响应超时
retry 3 #表示重试次数
delay_before_retry 3 #表示重试间隔
}
}
real_server 192.168.100.80 80 {
weight 1
TCP_CHECK {
connect_timeout 10 #表示10秒无响应超时
retry 3 #表示重试次数
delay_before_retry 3 #表示重试间隔
}
}
}
我的配置文件
#master
global_defs {
router_id mysql_ha
}
vrrp_instance VI_1 {
state BACKUP
interface ens34
virtual_router_id 51
priority 100
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.1.210
}
}
virtual_server 192.168.1.201 3306 {
delay_loop 6
lb_algo rr
lb_kind DR
persistence_timeout 60
protocol TCP
real_server 192.168.1.201 3306 {
weight 1
notify_down /etc/keepalived/keepalived_stop.sh
TCP_CHECK {
connect_timeout 3
retry 3
delay_before_retry 3
connect_port 3306
}
}
}
#slave
global_defs {
router_id mysql_ha
}
vrrp_instance VI_1 {
state BACKUP
interface ens34
virtual_router_id 51
priority 100
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.1.210
}
}
virtual_server 192.168.1.202 3306 {
delay_loop 6
lb_algo rr
lb_kind DR
persistence_timeout 60
protocol TCP
real_server 192.168.1.202 3306 {
weight 1
notify_down /etc/keepalived/keepalived_stop.sh
TCP_CHECK {
connect_timeout 3
retry 3
delay_before_retry 3
connect_port 3306
}
}
}
杀死keepalived的脚本,防止脑裂
/etc/keepalived/keepalived_stop.sh
echo '#!/bin/bash' >/etc/keepalived/keepalived_stop.sh echo "pkill keepalived" >>/etc/keepalived/keepalived_stop.sh chmod u+x /etc/keepalived/keepalived_stop.sh
【3.6】修改默认日志文件位置
#默认错误日志位置:/var/log/messages
#(1)修改文件 yum的话 为 /etc/sysconfig/keepalived
vim /usr/local/keepalived/etc/sysconfig/keepalived
#左边改成右边
KEEPALIVED_OPTIONS="-D" =》 KEEPALIVED_OPTIONS="-D -d -S 0"
# --dont-release-ipvs -I Dont remove IPVS topology on daemon stop.
# --dump-conf -d Dump the configuration data.
# --log-detail -D Detailed log messages.
# --log-facility -S 0-7 Set local syslog facility (default=LOG_DAEMON)
#(2)修改日志级别参数文件
vi /etc/rsyslog.conf
#在最后一行加上
local0.* /var/log/keepalived.log
#(3)重启日志服务
systemctl restart rsyslog
【3.7】启动、查看keepalived
systemctl daemon-reload #重新装载服务
systemctl start keepalived #启动服务
systemctl enable keepalived #设置服务开机自启
systemctl status keepalived #查看服务状态,有没有报错最快可以看这里
ps -ef|grep keepalived|grep -v "grep" #查看服务进程
【3.8】基于mysql连接的核验
先看看机器信息
用mysql连接虚拟IP地址,查看是哪个机器。
mysql -uroot -p123456 -h192.168.1.210
果然是DB1。
【3.9】故障转移测试
因为我们设置的是通过3306端口去做连接访问操作,所以只要mysql挂掉,3306端口也就不可访问了,就可以故障转移了。
我们实践一下,如下图,先关闭DB1的mysql
systemctl stop mysql
(1)查看IP地址,是否有虚拟IP
由上图可知,很明显已经飘到DB2机器上来了。
(2)用连接虚拟IP mysql
mysql -uroot -p123456 -h192.168.1.210
结果是DB2,证明连上的确实是我们想要的结果。
【keepalived故障处理】
(1)vrrp_script 定义的脚本不执行
(1)WARNING - script '/etc/keepalived/bin/check.sh' is not executable for uid:gid 0:0 - disabling.
需要加权限 chmod +x 脚本名
(2)vip无法ping通,无法访问端口
#vrrp_strict
keepalived.conf中vip配置好后,通过ip addr可以看到vip已经顺利挂载,但是无法ping通,并且防火墙都已关闭;
原因是keepalived.conf配置中默认vrrp_strict打开了,需要把它注释掉。重启keepalived即可ping通。
(3)如何抓包查看
tcpdump -i ens160 vrrp
tcpdump -i eth0 -n 'host 224.0.0.18'
(4)2个节点均有VIP
1、VRRP异常,主备都有VIP,备机收不到主节点的vrrp报文
原因是keepalived.conf配置中默认vrrp_strict打开了,需要把它注释掉。重启keepalived即可ping通。
2、组播被禁用,使用单播解决
unicast_src_ip 192.168.1.14 # 配置单播的本机地址
unicast_peer {
192.168.1.15 #配置单播的目标地址
} #keepalived在组播模式下所有的信息都会向224.0.0.18的组播地址发送,产生众多的无用信息,并且会产生干扰和冲突,可以将组播的模式改为单拨。也有可能组播被上级禁用。这是一种安全的方法,避免局域网内有大量的keepalived造成虚拟路由id的冲突。
3、防火墙没有关闭,导致A和B之间不能通信,都判断自己为master绑定vip
4、keepalived的vrid与别人的相同,并且密码还都是一样的导致,keepalived报错
(5)Unsafe permissions found for script '/etc/keepalived/bin/recover.sh'.
脚本权限不能777.
(6)keepalived报错 invalid user/group for notify script(SELINUX问题)
(7)两边都有VIP,应该是开了 firewalld 防火墙 VRRP协议没开通。
(8)WARNING - default user 'keepalived_script' for script execution does not exist - please create.
script_user root
enable_script_security
(9)Script user '/etc/keepalived/notify.sh fault' does not exist
注意 notify_stop "url stop",这里 notify_stop 和后面的参数只能又一个空格
参考文档
使用Keepalived实现MySQL主从高可用:https://blog.csdn.net/wzy0623/article/details/80916567
keepalived.conf详细参考:https://blog.csdn.net/shmnh/article/details/42000615
我的文章相关参考:mysql keepalived双主ha