linux集群架构-keepalived高可用
1.什么是高可用,为什么要设计高可用?
两台机器启动着相同的业务系统时,当有一台宕机,另外一台服务器能快速的接管,对于访问的用户是减少系统不能提供服务的时间
2.高可用使用什么工具来实现?硬件还是软件?
软件:keepalived
3.keepalived如何实现高可用?
通过vrrp协议实现,虚拟路由冗余协议
4.
5.
6.
7.keepalived高可用的安装与配置
10.0.0.5
10.0.0.6两台机器都做了负载均衡
1.安装
yum install keepalived -y
2.配置(master |backup)
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf global_defs { router_id lb01 } vrrp_instance VI_1 { state MASTER interface eth0 virtual_router_id 50 priority 150 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 10.0.0.3 } }
BACKUP
[root@lb02 ~]# cat /etc/keepalived/keepalived.conf global_defs { router_id lb02 } vrrp_instance VI_1 { state BACKUP interface eth0 virtual_router_id 50 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 10.0.0.3 } }
启动
[root@lb01 ~]# systemctl start keepalived
[root@lb01 ~]# systemctl enable keepalived
验证
[root@lb01 ~]# ip addr|grep 10.0.0.3
8.keepalived高可用抢占式与非抢占式?
1.master故障----backup顶上-----master恢复----- 抢占式 默认
2.master故障----backup顶上------master恢复-----backup继续工作 非抢占式
1、两个节点的state都必须配置为BACKUP(官方建议)
2、两个节点都在vrrp_instance中添加nopreempt参数
3、其中一个节点的优先级必须要高于另外一个节点的优先级。
两台服务器都角色状态启用nopreempt后,必须修改角色状态统一为BACKUP,唯一的区分就是优先级。
特点:
抢占:硬件配置不一
非抢占:硬件配置一致
keepalived高可用与nginx集成,地址实现漂移高可用
nginx与keepalivd本质上没有什么关系,但nginx需要借助keepalived VIP 地址漂移 实现高可用
9.如果nginx宕机,会导致用户请求失败,但keepalived并不会进行切换,所以需要编写一个脚本检测nginx的存活
1.判断nginx进程是否存在 ps aux|grep nginx|grep -v grep 2.判断nginx的端口是否存在 netstat -lntp|grep :80|wc -l 3.通过curl来模拟访问,判断访问结果是否ok curl -H Host:url.oldxu.com http://10.0.0.3
编写脚本
[root@lb01 ~]# mkdir /scripts [root@lb01 ~]# vim /scripts/check_web.sh #!/usr/bin/bash nginx_port=$(netstat -lntp|grep :80|wc -l) if [ $nginx_port -ne 1 ];then systemctl start nginx &>/dev/null rc=$? sleep 3 if [ $rc -ne 0 ];then systemctl stop keepalived fi fi
[root@lb01 ~]# chmod +x /scripts/check_web.sh
2.keeplaived调用该脚本
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf global_defs { router_id lb01 } 定义脚本名称,以及脚本所在的路径 vrrp_script check_web { script "/scripts/check_web.sh" interval 5 } vrrp_instance VI_1 { state MASTER #nopreempt interface eth0 virtual_router_id 50 priority 150 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 10.0.0.3 } #调用脚本名称 track_script { check_web } }
模拟nginx停止,检查nginx是否会被拉起
systemctl stop nginx
systemctl starus nginx
10keepalived高可用脑裂与故障解决
脑裂(split-brain),指在一个高可用(HA)系统中,当联系着的两个节点断开联系时,本来为一个整体的系统,分裂为两个独立节点,这时两个节点开始争抢共享资源,结果会导致系统混乱,数据损坏。
对于无状态服务的HA,无所谓脑裂不脑裂;
但对有状态服务(比如MySQL)的HA,必须要严格防止脑裂。
(但有些生产环境下的系统按照无状态服务HA的那一套去配置有状态服务,结果可想而知...)
在备上编写检测脚本,测试如果能ping通主并且备节点还有VIP的话则认为产生了脑裂
[root@lb02 conf.d]# cat /scripts/check_spilt.sh vip=10.0.0.3 master_ip=10.0.0.5 ping -c2 $master_ip &>/dev/null if [ $? -eq 0 ];then ip_check=$(ip addr | grep "$vip" | wc -l) if [ $ip_check -eq 1 ];then echo "脑列" systemctl stop keepalived fi fi
执行脚本
[root@lb02 conf.d]# cat /etc/keepalived/keepalived.conf global_defs { router_id lb02 } vrrp_script check_spilt { script "/scripts/check_spilt.sh" interval 3 } vrrp_instance VI_1 { state BACKUP nopreempt interface eth0 virtual_router_id 50 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 10.0.0.3 } track_script { check_spilt } }
keeplaived使用:
1.不能在公有云上使用
2.公有云要想实现负载均衡高可用-----> 购买的SLB 自带高可用
3.虚拟IP咋使--->真实的硬件环境:
[root@lb01 ~]# cat /etc/keepalived/keepalived.conf global_defs { router_id lb01 }
定义脚本名称,以及脚本所在的路径vrrp_script check_web { script "/scripts/check_web.sh" interval 5}
vrrp_instance VI_1 {state MASTER#nopreemptinterface eth0virtual_router_id 50priority 150advert_int 1authentication {auth_type PASSauth_pass 1111}virtual_ipaddress {10.0.0.3}
#调用脚本名称track_script {check_web}}