keepalived+nginx 高可用集群

一、什么是高可用?

nginx做负载均衡,能达到分发请求的目的,但是不能很好的避免单点故障。

1、nginx集群单点问题

  • 分发器宕机怎么处理?
    假如nginx服务器挂掉了,那么所有的服务也会跟着瘫痪 。
    一种方法是人为监控,发现主分发器宕机后,立马登录备分发器,并给它分配虚ip。
    另一种办法是用软件来替代人来监控,自动登录备分发器,分配虚ip。
  • 数据服务器宕机怎么处理?
    分发器可以自动判断数据服务器的存活状态,不对宕机服务器要数据。

2、Keepalived介绍

Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使 其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
  总结来说:Keepalived软件是一个监控+自愈的软件。
  运行协议是VRRP,主分发器的keepalived会向网络中发组播,宣告自己还活着,组播地址:224.0.0.18。

$ tcpdump -nn -vvv -i ens33 vrrp     #查看组播的包
     192.168.31.40 > 224.0.0.18: vrrp 192.168.31.40 > 224.0.0.18: VRRPv2, Advertisement, vrid 51, prio 100, authtype simple, intvl 1s, length 20, addrs: 192.168.31.213 auth "1111^¥##" 
输出解析:192.168.31.40是master,目标地址是224.0.0.18,使用的协议是VRRPv2版本,虚拟id是51,优先级是100,简单验证类型,一秒发一次,长度20字节,虚Ip是192.168.31.213, 验证的密码是111#$Z%#

二、keepalived安装管理

1、keepalived下载

keepalived官网下载地址
  
  linux下载keepalived软件:

$ wget http://www.keepalived.org/software/keepalived-2.0.8.tar.gz

2、keepalived安装

使用如下shell脚本keepalived_instll.sh安装keepalived软件。

$ sh keepalived_install.sh 
#keepalived安装脚本
#!/bin/bash 
pkg=keepalived-2.0.8.tar.gz tar xf $pkg
yum -y install kernel-devel
ln -s /usr/src/kernels/3.10.0-862.14.4.el7.x86_64/ /usr/src/linux
cd keepalived-2.0.8/
yum install openssl-* -y
./configure --prefix=/usr/local/keepalived
make
make install
mkdir -pv /etc/keepalived
cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/ 
ln -s /usr/local/keepalived/sbin/keepalived /sbin/

3、启动keepalived

$ systemctl start keepalived

三、构建高可用集群

1、试验环境准备

主机名 | IP | 角色 | 系统 | 配置 | 软件

  • | :-: | -: | -: | -: | -:
    Master.ayitula.com | 192.168.31.40 | 主分发器 | centos7.5 | 2核4G | Nginx+keepalived
    Backup.ayitula.com | 192.168.31.41 | 备分发器 | centos7.5 | 2核4G | Nginx+keepalived
    Web01.ayitula.com | 192.168.31.42 | 数据服务器1 | centos7.5 | 2核4G | Nginx
    Web02.ayitula.com | 192.168.31.43 | 数据服务器2 | centos7.5 | 2核4G | Nginx

2、软件环境部署步骤

1)分发器:nginx+keepalived
  2)数据服务器:Nginx
  3)配置Nginx分发器
  4)配置数据服务器页面(web01 web02)
  5)配置keepalived.conf
  6)测试

3、配置Nginx集群

upstream web {
    server 192.168.31.42 max_fails=2 fail_timeout=3;    # 超时时间3秒内失败2次认为服务器死了
    server 192.168.31.43 max_fails=2 fail_timeout=3;
}
server { 
    listen 80;
    server_name localhost; 
    location / {
        proxy_pass http://web;
    } 
}

4、配置keepalived

(1)主分发器keepalived

! Configuration File for keepalived

global_defs {
    router_id NGINX_DEVEL
}

vrrp_script check_nginx {    # 定义一个脚本
    script "/etc/keepalived/nginx_pid.sh"        # 脚本路径
    interval 2        # 探针,此处是每两秒执行一次脚本
    fall 1             # 失败次数  1
}

vrrp_instance nginx {     # 定义名为nginx实例
    state MASTER          # 主机状态
    interface ens33        # 网卡
    mcast_src_ip 192.168.31.40      # 发组播
    virtual_router_id 51         # 虚拟id
    priority 100           # 优先级
    advert_int 1        # 探针,一秒发一次组播
    authentication {
        auth_type PASS
        auth_pass 1111    # 密码
    }
    track_script {
        check_nginx
    }
    virtual_ipaddress {      # 虚ip
        192.168.31.213/24
    }
}

(2)备分发器keepalived

#cat /etc/keepalived/keepalived.conf 
! Configuration File for keepalived 
global_defs {
    router_id NGINX_DEVEL 
}
vrrp_script check_nginx {
    script "/etc/keepalived/nginx_pid.sh" 
    interval 2
    fall 1
}
vrrp_instance nginx {
    state BACKUP
    interface ens33 
    mcast_src_ip 192.168.31.41 
    virtual_router_id 51
    priority 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111 
    }
    track_script { 
        check_nginx
    } 
    virtual_ipaddress {
        192.168.31.213/24 
    }
}

5、编写关联脚本nginx_pid.sh

#!/bin/bash
nginx_kp_check () {
    nginxpid=`ps -C nginx --no-header |wc -l`
    if [ $nginxpid -eq 0 ];then
        /usr/local/nginx/sbin/nginx
        sleep 1
        nginxpid=`ps -C nginx --no-header |wc -l`
        if [ $nginxpid -eq 0 ];then
            systemctl stop keepalived
        fi
    fi
}

nginx_kp_check

脚本原理:该脚本检查nginx进程是否存在,如果进程没了,说明分发器挂了,尝试启动分发器,1秒后检查分发器启动没有,如果没有启动直接关闭keepalived,停止发组播,备就自动开始工作了。

四、故障测试

1、分发器宕机测试

分发器由keepalived来管理

$ watch  -n1 killall nginx    # 每隔一秒杀死一次所有nginx

2、数据服务器宕机测试

数据服务器则由nginx来管理。使用如下两个参数就可实现对数据服务器管理:

  • max_fails
    允许请求失败的次数默认为1,当超过最大次数时,返回proxy_next_upstream模块定义的错误;
  • fail_timeout
    失败超时时间,在连接Server时,如果在超时时间之内超过max_fails指定的失败次数,会认为在fail_timeout时间内Server不可用,默认为10s
upstream web {
    server 192.168.31.42 max_fails=2 fail_timeout=3;    # 超时时间3秒内失败2次认为服务器死了
    server 192.168.31.43 max_fails=2 fail_timeout=3;
}
posted @ 2018-12-24 23:36  休耕  阅读(1681)  评论(0编辑  收藏  举报