Keepalived服务详解

1. VRRP协议

1.1 VRRP协议概述

VRRP协议的出现是为了解决静态路由的单点故障，它是通过一种竞选机制来将路由任务交给某个vrrp路由器的
在VRRP物理结构中，有多个物理的VRRP路由器，其中有一台称为“master”（主节点路由器），其他的都是“backup”（备节点路由器）
- master和backup的身份，是通过他妈的优先级来定义竞选的
在VRRP虚拟结构中，虚拟路由都是通过“MAC+VRID”的形式来标识的，如“00-00-5E-00-01-{VRID}”
- 只有master节点才会发送VRRP广告包（vrrp advertisement message）
- 当master节点宕掉的时候，backup中优先级最高的VRRP设备会抢占并升级为master

1.2 VRRP的术语

虚拟路由器
- 由一个Master路由器和多个Backup路由器组成，主机将虚拟路由器当做默认网关（将Master和Backup看做一个整体）
VRID
- 虚拟路由器的标识，有相同的VRID的一组路由器构成一个虚拟路由器
Master路由器
- 虚拟路由器中承担报文转发任务的路由器
Backup路由器
- 虚拟路由器中备份节点路由器
虚拟IP地址
- 虚拟路由器的IP地址，一个虚拟路由器可以拥有一个或多个IP地址
VIP
- IP地址拥有者，接口IP地址与虚拟IP地址相同的路由器被称为IP地址拥有者
VMAC
- 虚拟MAC地址，一个虚拟路由器拥有一个虚拟MAC地址，通常情况下，虚拟路由器回应ARP请求使用的是虚拟MAC地址
优先级
- VRRP根据优先级来确定虚拟路由器中每台路由器的地位
非抢占式
- 如果backup路由器工作在此模式下，则若Master路由器没有出现故障，backup即使随后被配置了更高的优先级也不会成为Master
抢占式
- 如果backup路由器工作在抢占方式下，当它收到VRRP报文后，会将主机的优先级与通告报文中的优先级进行比较，
- 如果主机的优先级比当前的Master路由器的优先级高，就会主动抢占成为Master路由器，否则，将保持Backup状态

1.3 VRRP的工作过程

虚拟路由器中的路由器根据优先级选举出Master
- Master路由器通过发送免费ARP报文，将主机的虚拟MAC地址通知给它连接的设备或者主机，从而承担报文转发任务
Master路由器周期性发送VRRP报文，以公布其配置信息（优先级等）和工作状况
如果Master路由器出现故障，虚拟路由器中的Backup路由器将根据优先级重新选举出新的Master
虚拟路由器状态切换时，Master路由器由一台设备切换为另一台设备
- 新的Master路由器发送一个携带虚拟路由器的MAC地址和虚拟IP地址信息的免费ARP报文，以更新与它连接的主机中的ARP相关的信息
- 网路中的主机感知不到Master路由器已经切换为另外一台设备
Backup路由器的优先级高于Master路由器时，由Backup路由器的工作方式（抢占方式和非抢占方式）决定是否重新选举Master
为了保证Master路由器和Backup路由器能够协调工作，VRRP需要实现以下功能
- Master路由器的选举
- Master路由器状态的通告
- 为了提高安全性，VRRP还提供了认证功能

1.4 Master路由器的选举

VRRP根据优先级来确定虚拟路由器中每台路由器的角色（Master路由器或Backup路由器），优先级越高，则越有可能成为Master路由器
初始创建的路由器在Backup状态，通过VRRP报文获知虚拟路由器中其他成员的优先级
- 如果VRRP报文中Master路由器的优先级高于自己的优先级，则路由器保持在Backup状态
- 如果VRRP报文中Master路由器的优先级低于自己的优先级
  - 采用抢占工作方式的路由器将抢占成为Master状态，周期性的发送VRRP报文
  - 采用非抢占式工作方式的路由器仍保持Backup状态
- 如果在一定时间内没有收到VRRP报文，则路由器切换为Master状态
VRRP优先级的取值范围为0到255（数值越大优先级越高），可配置的范围是1到254
- 优先级0为系统保留给路由器放弃Master位置时候使用，255则是系统保留给IP地址拥有者使用
- 当路由器为IP地址拥有者时，其优先级始终为255，因此当虚拟路由器内存在IP地址拥有者时，只要其工作正常，则为Master路由器

1.5 Master路由器状态的通告

Master路由器周期性发送VRRP报文，在虚拟路由器中公布其配置信息（优先级等）和工作状况
- Backup路由器通过接收到VRRP报文的情况来判断Master路由器是否工作正常
Master路由器主动放弃Master地位（如Master路由器退出虚拟路由器）时
- 会发送优先级为0的VRRP报文，致使Backup路由器快速切换变成Master路由器，这个切换时间称为Skew time
- 计算方式为（256-Backup路由器的优先级）/256，单位为秒
当Master路由器因故障不能发送VRRP报文时，Backup路由器并不能立即知道其工作状况
- Backup路由器等待一段时间后，如果还没接收到VRRP报文，那么会认为Master路由器无法正常工作，而把自己升级为Master路由器，周期性发送VRRP报文，如果此时多个Backup路由器竞争Master路由器的位置，将通过优先级来选举Master路由器，Backup路由器默认等待的时间称为Master_Down_Interval，取值为:(3*VRRP报文的发送时间间隔)+Skewtime，单位为秒

在性能不够稳定的网络中，Backup路由器可能因为网络堵塞而在Master_Down_Interval期间没有收到Master路由器的报文而主动抢占为Master位置，如果此时原Master路由器的报文又到达了，就会出现虚拟路由器的成员频繁的进行Master抢占现象，为了缓解这种现象的发生，特制定了延迟等待定时器，它可以使得Backup路由器在等待了Master_Down_Interval后，再等待延迟等待时间，如在此期间仍然没有收到VRRP报文，此时Backup路由器才会切换为Master路由器，对外发送VRRP报文。

1.6 认证方式

1）无认证

不进行任何VRRP报文的合法性认证，不提供安全性保障

2）简单字符认证

在一个有可能受到安全威胁的网络中，可以将认证方式设置为简单字符认证（一般就采用这种认证）
发送VRRP报文的路由器将认证字填入到报文中，而收到VRRP报文的路由器会将收到的VRRP报文中的认证字和本地配置的认证字进行比较，如果认证字相同，则认为接受到的报文是合法的VRRP报文，否则认为接收到的报文是一个非法报文

3）MD5认证

在一个非常不安全的网络中，可以将认证方式设置为MD5认证
发送VRRP报文的路由器利用认证字和MD5算法对VRRP报文进行加密，加密后的报文保存在Authentication Header（认证头）中，收到VRRP报文的路由器会利用认证字解密报文，检查该报文的合法性

2. keepalived

2.1 keepalived概述

1）keepalived的功能

对后端RealServer进行健康状况检查，支持4层、5层和7层协议进行健康检查
对负载均衡器进行高可用，防止Director单点故障

2）keepalived的运作

通过VRRP（Virtual Router Redundancy Protocol）虚拟路由冗余协议来实现故障转移。
keepalived正常工作时，主节点（master）会不断的发送心跳信息给备节点（backup）
- 当备节点在一定时间内没有收到主节点的心跳信息时，备节点会认为主节点宕了，就会接管主节点上的资源，并继续向外提供服务保证其可用性
- 当主节点恢复时，备节点会自动让出资源并再次自动成为备节点

3）keepalived监控LVS

使用keepalived监控、高可用LVS集群时（keepalived+lvs），并不需要在Director上使用ipvsadm额外配置ipvs规则。
因为keepalived中集合了管理ipvs规则的组件（ipvs wrapper），可以直接在keepalived的配置文件中配置ipvs相关规则，在解析配置文件时会通过特定的组件将规则发送给到内核中的ipvs模块。

2.2 keepalived软件结构

1）VRRP协议

vrrp协议在Linux主机上以守护进程方式的实现，原生设计目的是为了高可用ipvs服务
能够根据配置文件生成ipvs规则，并对各RS的健康做检测
- vrrp_script
- vrrp_track
基于vrrp协议完成地址滚动
为vip地址所在的节点生成ipvs规则（在配置文件中预先定义）
基于脚本调用接口通过执行脚本完成脚本中定义的功能，进而影响集群事务

2）keepalived的组件

keepalived服务启动时，将产生三个相关进程，一个父进程和两个子进程
- 主进程：Watchdog看门狗主进程
- 子进程1：VRRP Child
- 子进程2：Healthchecking Child
两个子进程都会开启本地套接字Unix Domain Socket
- 当keepalived服务启动后，父进程会通过unix domain socket每隔5秒发送一个hello消息给子进程
- 如果父进程无法发送消息给子进程，将认为子进程出现问题，于是会重启子进程

核心组件
- Watchdog
  - 看门狗，负责fork和监控子进程，对Checkers和vrrp stack进行监控
- Checkers
  - 负责RealServer的健康状况检查，并在LVS的拓扑中移除、添加RealServer
  - 它支持layer4/5/7层的协议检查，该组件使用独立的子进程负责，但被父进程监控
- VRRP Stack
  - 提供Director的故障转移功能从而实现Director的高可用
  - 该组件可独立提供功能，无需LVS的支持，该组件使用独立的子进程负责，但被父进程监控
- System Call
  - 提供读取自定义脚本的功能，该组件在使用时，将临时产生一个子进程来执行任务
- IPVS wrapper
  - 负责将配置文件中的IPVS相关规则发送到内核的ipvs模块
- Netlink Reflector
  - 用来设定、监控vrrp的ip地址
IO复用器
内存管理
配置文件分析器

3）工作模型

主备：单虚拟路由器
主主：主/备（虚拟路由器1）+ 备/主（虚拟路由器2）

3. keepalived的配置和使用

3.1 使用前的配置

各节点时间要同步
确保iptables和selinux不会成为阻碍
确保各节点的用于集群服务的接口支持MULTICAST通信
- 开启网卡的多播功能：ip link set multicast on dev ens33
- D类地址：224-239（多播地址的范围）
各节点之间可通过主机名互相通信（可选）
- 节点的名称设定与hosts文件中解析的主机名都要保持一致
- uname -n 获得的主机，与解析的主机名要相同
各节点之间基于密钥认证的方式通过ssh互相通信（可选）

3.2 程序环境

主程序文件
- /usr/sbin/keepalived
Unit file
- /usr/lib/systemd/system/keepalived.service
- Unix file 的配置文件：/etc/sysconfig/keepalived
配置文件
- /etc/keepalived/keepalived.conf

3.3 配置文件概述

# 全局配置（全局配置有Global definitions和Static routes/address，全局定义和静态路由）
# GLOBAL CONFIGURATION： 
     global_defs                 # Block id
         {
            ...
         }
        
# 配置vrrp实例（VRRP实例和VRRP同步组）
# VRRPD CONFIGURATION：
# vrrp instance                  # 虚拟路由器，VRRP实例
     vrrp_instance  NAME {
          ...
     }
# vrrp synchronization group     # VRRP同步组
     vrrp_sync_group  NAME  {
          ...
     }
# ipvs的相关配置
# LVS CONFIGURATION：
     # 集群服务，服务内的RS
     Virtual server groups 
     Virtual server               #ipvs集群的vs和rs

如果多个实例同进同退，那么就要把他们配置成一个同步组（高可用LVS的NAT模式时）
- 如下图所示，当vip1在网卡1上时，vip2必须要在网卡2上，所以vip1和vip2必须同进同退
- vip1在哪个节点上，vip2就应该在哪个节点上

3.4 配置文件详解

1）全局配置

### 全局配置 ###
global_defs {              # 全局部分定义邮件报警系统，可以不用定义
    notification_email {   # 定义邮件发送目标，收件人邮箱地址                
        acassen@firewall.loc
        failover@firewall.loc
    } 
    notification_email_from  hgzerowzh@qq.com # 定义发件人邮箱地址
    smtp_server 192.168.200.1    # 定义邮件发送服务器IP，本地发送写localhost
    smtp_connect_timeout 30      # 定义邮件服务器建立连接的超时时长
    router_id c7_node_03         # 标识keepalived服务器的字符串，物理节点的标识符；建议使用主机名

    vrrp_skip_check_adv_addr     # 如果通告与接收的上一个通告来自相同的master路由器，则不执行检查
    ！vrrp_strict                # 严格遵守VRRP协议，这一项最好关闭（加感叹号），若不关闭，可用vip无法被ping通
    vrrp_garp_interval 0.001     # 在一个接口发送的两个免费ARP之间的延迟，可以精确到毫秒级（默认是0）
    vrrp_mcast_group4 225.0.0.18 # IPV4多播地址，默认224.0.0.18，要改一改
    # 可以在多播地址上抓包来看vrrp报文：tcpdump -i ens33 -nn host 224.0.0.18
}

2）vrrp实例配置

### VRRP实例配置 ###
vrrp_instance NAME {
    state MASTER          # 定义实例的角色状态是master还是backup，在当前VRRP实例中此节点的初始状态
    interface eth0        # 定义vrrp绑定的接口，即接收或发送心跳通告的接口，即HA监测接口
    virtual_router_id 51  # 虚拟路由标识(VRID)，同一实例该数值必须相同，即master和backup中该值要相同
                               # 同一网卡上的不同vrrp实例，该值一定不能相同，取值范围为0-255，默认为51
    priority 100          # 该vrrp实例中本机的keepalived的优先级，优先级最高的为master（可用范围0-255）
                               # 该选项的优先级高于state选项，
                               # 即若state指定的是backup，但这里设置的值最高，则仍为master
    advert_int 1          # 心跳信息发送和接收时间间隔，单位为秒

    authentication {      # 认证方式，同一实例中这个配置必须完全一样才可通过认证，只建议使用PASS认证
        auth_type PASS         # 使用简单字符认证的方式
        auth_pass 1111         # 最多支持8字符，超过8字符将只取前8字符
    }

    virtual_ipaddress {   # 设置的VIP，当master出现故障后，VIP会故障转移到backup
                               # 这些vip默认配置在interface指定的接口别名上，可使用dev选项来指定配置接口
                               # 使用ip add的方式添加，若要被ifconfig查看，在IP地址后加上label即可
       192.168.200.16 label eth0:1
       192.168.200.17
       192.168.200.19/24 dev eth1
       # 格式：<IPADDR>/<MASK> brd <IPADDR> dev <STRING> scope <SCOPE> label <LABEL>
    }

    # 使用非抢占模式
    nopreempt   
         
    # 使用延迟抢占模式
    preempt_delay  TIME     
}

3）定义通知脚本

定义格式：可以通过notify参数来实现master和backup的切换，且可以附加执行通知脚本

vrrp_instance {
    ...
    notify_master  <STRING>|<QUOTED-STRING>  # 当切换到master模式时，执行此脚本
    notify_backup  <STRING>|<QUOTED-STRING>  # 当切换到backup模式时，执行此脚本
    notify_fault  <STRING>|<QUOTED-STRING>   # 当切换到fault模式时，执行此脚本
    notify  <STRING>|<QUOTED-STRING>
}

定义示例

vrrp_instance {
    ...
    notify_master "/etc/keepalived/notify.sh master"
    notify_backup "/etc/keepalived/notify.sh backup"
    notify_fault "/etc/keepalived/notify.sh fault"
}

脚本示例

#!/bin/bash
# Author: hgzerowzh
# Description: An notify script
#
contact='root@localhost'

notify() {
        mailsubject="$(hostname) to be $1: vip floating"
        mailbody="$(date +'%F %H:%M:%S'): vrrp transition, $(hostname) changed to be $1"
        echo $mailbody | mail -s "$mailsubject" $contact
}

case $1 in
    master)
    notify master
    exit 0
    ;;
    backup)
    notify backup
    exit 0
    ;;
    fault)
    notify fault
    exit 0
    ;;
    *)
    echo "Usage: $(basename $0) {master|backup|fault}"
    exit 1
    ;;
esac

3.5 双主配置示例

1）配置图示

2）配置示例

### node1:###
    vrrp_instance VI_1 {
            state MASTER
            interface eno16777736
            virtual_router_id 101
            priority 100
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass ZPNnTQ6F
            }
            virtual_ipaddress {
                    172.16.100.9/16
            }
    }
    vrrp_instance VI_2 {
            state BACKUP
            interface eno16777736
            virtual_router_id 102
            priority 99
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass IWyijM5Q
            }
            virtual_ipaddress {
                    172.16.100.10/16
            }
    }                                
            
### node2:###
    vrrp_instance VI_1 {
            state BACKUP
            interface eno16777736
            virtual_router_id 101
            priority 99
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass ZPNnTQ6F
            }
            virtual_ipaddress {
                    172.16.100.9/16
            }
    }
    vrrp_instance VI_2 {
            state MASTER
            interface eno16777736
            virtual_router_id 102
            priority 100
            advert_int 1
            authentication {
                    auth_type PASS
                    auth_pass IWyijM5Q
            }
            virtual_ipaddress {
                    172.16.100.10/16
            }
    }

4. keepalived中配置ipvs

4.1 ipvs配置语法格式

1）定义Virtual Server

virutal_server  vip  port  {  # 虚拟服务地址和端口，使用空格分隔，其中地址为VIP
       ...
}

virtual_server fwmark int  {  # 可以使用防火墙标记来定义
        ...
}
        
### 常用的参数 ###
    delay_loop  <INT>                       # 对后端主机做检测，每隔多长时间发一次请求
    lb_algo   rr|wrr|lc|wlc|lblc|sh|dh      # 调度算法
    lb_kind   NAT|DR|TUN                    # 集群类型
    persistence_timeout  <INT>              # 持久连接时长
    protocol TCP                            # 1.3.0版本之前只支持TCP
    sorry_server  <IPADDR>  <PORT>          # 当所有的RS都挂掉，则使用这里定义的主机提供服务

2）定义Real Server & 健康状态检测

real_server <IPADDR> <PORT>  {
    ### 常用的参数 ###
    weight <INT>                          # 权重
    notify_up  <STRING>|<QUOTED-STRING>   # 上线脚本
    notify_down  <STRING>|<QUOTED-STRING> # 下线脚本
    ...

    ### 健康状态检测机制（web应用层检测）
    HTTP_GET|SSL_GET
    {
         # 检测参数
         url  {     
                 path  <STRING>        # 对哪个url做检测，使用path指明url
                 status_code <INT>     # 要获得什么响应码才算正确
                 digest <STRING>       # 获取内容的校验码跟所期望的一样 
         }
         nb_get_retry <INT>            # get请求的重试次数
         delay_before_retry <INT>      # 两次重试之间的时间间隔
         connect_timeout <INTEGER>     # 连接超时时长，默认为5s
         warmup <INT>                  # 健康状态检测延迟
    }
    
    ### 传输层健康状态检测（tcp协议层）
    TCP_CHECK
    {
         # 检测参数
         connect_timeout  <INTEGER>    # 每次发起连接时的超时时间
         
         nb_get_retry <INT>            # get请求的重试次数
         delay_before_retry <INT>      # 两次重试之间的时间间隔
         connect_timeout <INTEGER>     # 连接超时时长，默认为5s
         warmup <INT>                  # 健康状态检测延迟
         
         # 其它参数
         connect_ip <IP ADDRESS>       # 向哪个地址的哪个端口做检测
         connect_port <PORT>
         bindto <IP ADDRESS>           # 自己使用固定的地址当源地址发请求
         bind_port <PORT>
    }
}

4.2 keepalived + LVS（NAT）

1）主节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_03
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.18
}

vrrp_instance VI_1 {
    state MASTER
    interface ens37
    virtual_router_id 66
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {  
       172.168.1.99/24   # 这个虚拟ip是流动网关地址
    }
}

vrrp_instance VI_2 {
    state MASTER
    interface ens33
    virtual_router_id 67
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass taba
    }
    virtual_ipaddress {
       10.0.0.11/24      # 这个虚拟ip是外网访问的浮动ip
    } 
}

# 将VI_1和VI_2做成一个同步组，在这个节点上，VI_1和VI_2同进退
vrrp_sync_group VG_1 {   
    group {
        VI_1
        VI_2
    }
}

# 虚拟服务地址和端口，使用空格分隔，其中地址为外网VIP
virtual_server  10.0.0.11 80 {  
    delay_loop 2              # 健康检查时间间隔
    lb_algo rr                # 定义负载均衡LB的算法，这里使用的是rr轮询调度算法
    lb_kind NAT               # lvs的模型，有NAT、DR、TUN三种
    ! persistence_timeout 3   # 持久会话保持时长
    protocol TCP              # 监控服务的协议类型，1.3.0版本之前只支持tcp，之后还支持udp

    real_server 172.168.1.101 80 {  # 定义后端的real_server部分，地址和端口使用空格分隔
        weight 1              # lvs权重
        HTTP_GET {            # 监控状况检查的检查方式，常见的有HTTP_GET、SSL_GET、TCP_CHECK、MISC_CHECK
            url {
              path /          # 指定http_get健康状况检查的路径，例如检查index.html是否正常
                  status_code 200
                         # 健康状况需要状态码，可以是status_code、digest、或者digest+status_code
                         # digest值用keepalived的genhash命令生成，一般使用status_code即可
                         # curl  -s  http://172.168.0.6 |  md5sum
                         # genhash -s 172.168.0.6 -p 80 -u /index.html
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 172.168.1.102 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2     # 表示3秒无响应就超时，即此realserver不健康，需重试连接
            nb_get_retry 3        # 表示重试3次，3次之后都超时就是宕机，防止误伤（nb=number）
            delay_before_retry 1  # 重试的时间间隔
        }                         # 时间如果太久，应改小
    }
}

2）备节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_04
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.18

}

vrrp_instance VI_1 {
    state BACKUP
    interface ens37
    virtual_router_id 66
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {
       172.168.1.99/24
    }
}

vrrp_instance VI_2 {
    state BACKUP
    interface ens33
    virtual_router_id 67
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass taba
    }
    virtual_ipaddress {
       10.0.0.11/24
    }
}

vrrp_sync_group VG_1 {
    group {
        VI_1
        VI_2
    }        
}

virtual_server  10.0.0.11 80 {
    delay_loop 2
    lb_algo rr
    lb_kind NAT
    ! persistence_timeout 3
    protocol TCP

    real_server 172.168.1.101 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 172.168.1.102 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

4.3 keepalived + LVS（DR）

1）主节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_03
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.16
}

vrrp_instance VI_1 {
    state MASTER
    interface ens33
    virtual_router_id 66
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {
       10.0.0.10
    }
}

virtual_server  10.0.0.10 80 {
    delay_loop 2
    lb_algo wrr
    lb_kind DR
    ! persistence_timeout 3
    protocol TCP

    real_server 10.0.0.205 80 {
        weight 2
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 10.0.0.206 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

2）备节点的配置

! Configuration File for keepalived

global_defs {
   notification_email {
     492540654@qq.com
     2469822904@qq.com
   }
   notification_email_from hgzero@localhost
   smtp_server localhost
   smtp_connect_timeout 30
   router_id c7_node_04
   vrrp_skip_check_adv_addr
   ! vrrp_strict
   vrrp_garp_interval 0
   vrrp_gna_interval 0
   vrrp_mcast_group4 225.0.0.16
}

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    virtual_router_id 66
    priority 99
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass niba
    }
    virtual_ipaddress {
       10.0.0.10
    }
}

virtual_server  10.0.0.10 80 {
    delay_loop 2
    lb_algo wrr
    lb_kind DR
    ! persistence_timeout 3
    protocol TCP

    real_server 10.0.0.205 80 {
        weight 2
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }

    real_server 10.0.0.206 80 {
        weight 1
        HTTP_GET {
            url {
              path /
              status_code 200
            }
            connect_timeout 2
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

3）在DR模式中各个Real Server上的自定义脚本

要在每个Real Server上执行此脚本

#!/bin/bash

vip=10.0.0.10
mask='255.255.255.255'

case $1 in
start)
    echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
    echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
    echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
    ifconfig lo:0 $vip netmask $mask broadcast $vip up
    route add -host $vip dev lo:0
    ;;
stop)
    ifconfig lo:0 down
    echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
    ;;
*) 
    echo "Usage $(basename $0) start|stop"
    exit 1
    ;;
esac

5. keepalived高可用nginx

5.1 keepalived高可用其他服务

1）原理

keepalived调用外部的辅助脚本进行资源监控，并根据监控的结果状态能实现优先动态调整

2）步骤

定义一个脚本

vrrp_script  <SCRIPT_NAME> {   # 脚本名，后面要基于脚本名来进行调用
        script  "/script.sh"   # 执行的命令或脚本
        interval  INT          # 每隔多少时间，这个监控脚本要执行一次
        weight   -INT          # 万一失败了，当前节点的权重要减去多少，一般来讲讲，减去后的值要小于备用节点
}

调用此脚本

# 在某个vrrp的示例中去调用脚本实例
track_script {
        SCRIPT_NAME_1
        SCRIPT_NAME_2
        ...
}

5.2 keepalived高可用nginx

1）配置keepalived.conf文件

global_defs {
    notification_email {
            root@localhost
    }
    notification_email_from  keepalived@localhost
    smtp_server 127.0.0.1
    smtp_connect_timeout 30
    router_id node1
    vrrp_mcast_group4 224.0.100.19
}

# 如果想要调整某个keepalived主机，只需要在keepalived目录下创建一个down文件
# 通过监测这个文件的存在与否，即可将该节点权重降低，从而可以去配置调整它
# 如果不想让它降权了，就将down文件删除
vrrp_script chk_down { 
    # 如果这个文件存在就错误退出，否则就正常退出  
    script  "[[  -f /etc/keepalived/down  ]]  &&  exit 1  ||  exit 0"  
    # 注意，这里最好将脚本写入shell文件中，然后在这里调用shell脚本文件，注意用全路径
        interval 1          
        weight -5           # 一旦上面的文件存在（错误退出），就将这个节点降权
        fall 1
        rise 1
}

vrrp_script chk_nginx {
    script  "killall  -0  nginx  &&  exit 0 ||  exit 1"  # 这里killall -0表示检测nginx进程是否存在
    # 注意，这里最好将脚本写入shell文件中，然后在这里调用shell脚本文件，注意用全路径
    interval  1             # 每隔一秒检测一次上面的脚本是否能成功执行
    weight  -5              # 如果脚本执行失败就将权重-2
    fall  3                 # 如果失败3次失败，才确认为失败
    rise  3                 # 需要成功的次数，如果3次检查都成功，那么就立即将减去的权重加回去
}

vrrp_instance  VI_1 {
    state  MASTER
    interface eno16777736
    virtual_router_id 14
    priority  100
    advert_int  1
    authentication {
            auth_type  PASS
            auth_pass 571f97b2  # 如果有多个vrrp实例，这里的密码一定不能相同
    }
    vritual_ipaddress {
            10.1.0.93/16  dev  eno16777736
    }
    track_script {              # 在这里来调用之前的脚本
            chk_down
            chk_nginx
    }

    notify_master  "/etc/keepalived/notify.sh  master"
    notify_backup  "/etc/keepalived/notify.sh  backup"
    notify_fault   "/etc/keepalived/notify.sh  fault"
}

2）定义notify脚本

#!/bin/bash
#
contact='root@localhost'
notify() {
        local  mailsubject="$(hostname) to be $1,  vip floating"
        local  mailbody="$(date  + '%F  %T' ): vrrp  transition, $(hostname)  changed  to  be  $1"
        echo "$mailbody"  |  mail  -s  "$mailsubject"  $contact
}

case  $1  in
master)
        # 当当前节点变成主节点的时候，就启用nginx服务
        systemctl  start  nginx.service  
        notify  master
        ;;
backup)
        # 当当前节点变成备用节点的时候，要启用nginx，防止备节点也被降权，导致vip没有被转移
        systemctl  start  nginx.service   
    notify  backup
        ;;
fault)
        # 当当前节点出错时，就停掉nginx服务（但是如果做nginx的双主，即使fault也不能停掉nginx）
        systemctl  stop  nginx.service  
        notify  fault
        ;;
*)
        echo  "Usage: $(basename  $0) { master|backup|fault}"
        exit  1
        ;;
esac

3）其他相关

# 监控关注的网络接口
    track_interface {
            IFACE_NAME_1
        IFACE_NAME_2
    }

# 在nginx上配置反向代理：
    upstream  websrvs  {
            server  192.168.10.11:80;
            server  192.168.10.12:80;
    }
    location  /  {
            proxy_pass  http:/websrvs;
    }

posted @ 2020-09-23 15:24 Praywu 阅读(1675) 评论(0) 收藏举报

刷新页面返回顶部

Pray

路漫漫其修远兮，吾将上下而求索