Linux下配置 Keepalived（心跳检测部署）

首先呢，我想先给大家简单介绍一下什么是keepalived：

Keepalived的作用是检测服务器的状态，如果有一台web服务器死机，或工作出现故障，Keepalived将检测到，并将有故障的服务器从系统中剔除，同时使用其他服务器代替该服务器的工作，当服务器工作正常后Keepalived自动将服务器加入到服务器群中，这些工作全部自动完成，不需要人工干涉，需要人工做的只是修复故障的服务器。

大家了解到Keepalived是什么东西了之后，咱们就进入主题。

1.下载

http://www.keepalived.org/download.html

或
wget http://www.keepalived.org/software/keepalived-1.2.2.tar.gz

2.安装
tar -zxvf keepalived-1.2.2.tar.gz
cd keepalived-1.2.2
./configure --prefix=/home/wangpl/mine/soft/keepalived-1.2.2
make && make install

补充：在大家进行./configure 有的机器会报错，这里为大家提供一个简单的解决方案。

1.遇到keepalived执行./configure --prefix=/usr/local/keepalived时报错：configure: error: Popt libraries is required

 解决方法：
yum install popt-devel
安装好popt的开发包。

重新./configure 即可。

<span style="color:#FF0000;">！！在完成Keepalived之前 咱们需要安装依赖包 防止在接下来安装过程中出错。</span>

<p align="left">yum install openssl-devel
yum install popt-devel
yum install ipvsadm
yum install libnl*</p>

3.方式
    安装到系统，默认的启动脚本里写的是系统路径，所以需要拷贝一些文件到系统目录下
   $ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/rc.d/init.d/keepalived /etc/init.d/
   $ cp /home/wangpl/mine/soft/keepalived-1.2.2/sbin/keepalived /usr/sbin/
   $ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/sysconfig/keepalived /etc/sysconfig/
   $ mkdir -p /etc/keepalived/
   $ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf

4.试用

进入目录进行启动cd /etc/init.d/

启动：sh keepalived start

停止：sh keepalived stop

重启：sh keepalived restart

5. （主从模式）配置keepalived.conf

global_defs {  
   notification_email {  
     root@localhost  
   }  
   notification_email_from root@localhost  
   smtp_server localhost  
   smtp_connect_timeout 30  
   router_id  NodeA  
}

默认的配置文件中，使用第三方smtp服务器，但这在现实中几乎没有意义（需要验证的原因），我们将其指定为localhost, 将通知信息的发送交给本地sendmail服务处理。或者把其内容全部删除掉只留下router_id NodeA。查阅说明文档得知route_id配置是为了标识当前节点，我将其设置为NodeA。当然两个节点的此项设置可相同，也可不相同。

    vrrp_instance VI_1 {  
        state MASTER   #指定A节点为主节点 备用节点上设置为BACKUP即可  
        interface eth0   #绑定虚拟IP的网络接口  
        virtual_router_id 51  #VRRP组名，两个节点的设置必须一样，以指明各个节点属于同一VRRP组  
        priority 100   #主节点的优先级（1-254之间），备用节点必须比主节点优先级低  
        advert_int 1   #组播信息发送间隔，两个节点设置必须一样  
        authentication {   #设置验证信息，两个节点必须一致  
            auth_type PASS  
            auth_pass 1111  
        }  
        virtual_ipaddress {   #指定虚拟IP, 两个节点设置必须一样  
            192.168.200.16/24   #VIP虚拟IP
            192.168.200.17 /24  #主服务器IP
           192.168.200.18 /24  #从服务器IP
        }  
    }

按同样的方法配置节点B并修改配置文件，可将A节点的配置文件复制到B节点，并修改以下几项：

router_id NodeB

state BACKUP

priority 99

其它项不必修改。

测试及验证：

执行命令 ip a （注意ifconfig命令无法查看到配置的虚拟IP），来查看。

6.（主从模式）脑裂问题

上述主从配置方式存在脑裂的可能，即两个节点实际都处于正常工作状态，但是无法接收到彼此的组播通知，这时两个节点均强行绑定虚拟IP，导致不可预料的后果。
这时就需要设置仲裁，即每个节点必须判断自身的状态（应用服务状态及自身网络状态），要实现这两点可使用自定义shell脚本实现，通过周期性地检查自身应用服务状态，并不断ping网关（或其它可靠的参考IP）均可。当自身服务异常、或无法ping通网关，则认为自身出现故障，就应该移除掉虚拟IP(停止keepalived服务即可）。主要借助keepalived提供的vrrp_script及track_script实现：

在keepalived的配置文件最前面加入以下代码，定义一个跟踪脚本：

vrrp_script check_local { #定义一个名称为check_local的检查脚本  
    script "/usr/local/keepalived/bin/check_local.sh" #shell脚本的路径  
    interval 5  #运行间隔  
}

再在vrrp_instance配置中加入以下代码使用上面定义的检测脚本：

track_script {  
  check_local  
}

我们在/usr/local/keepalived/bin/check_local.sh定义的检测规则可以是：

以上的路径及文件是自己定义的。

a.自身web服务故障（超时，http返回状态不是200）

b.无法ping通网关

c.产生以上任何一个问题，均应该移除本机的虚拟IP(停止keepalived实例即可)

但这里有个小问题，如果本机或是网关偶尔出现一次故障，那么我们不能认为是服务故障。更好的做法是如果连续N次检测本机服务不正常或连接N次无法ping通网关，才认为是故障产生，才需要进行故障转移。另一方面，如果脚本检测到故障产生，并停止掉了keepalived服务，那么当故障恢复后，keepalived是无法自动恢复的。我觉得利用独立的脚本以秒级的间隔检查自身服务及网关连接性，再根据故障情况控制keepalived的运行或是停止。

这里提供一个思路，具体脚本内容请大家根据自己的需要编写即可。

脚本/usr/local/nginx/check_nginx.sh"内容：

    #!/bin/bash  
    if [ "$(ps -ef | grep "nginx: master process"| grep -v grep )" == "" ]  
    then  
    /usr/local/nginx/sbin/nginx  
    sleep 5  
    if [ "$(ps -ef | grep "nginx: master process"| grep -v grep )" == "" ]  
    then  
    killall keepalived  
    fi  
    fi

//如果以上配置我介绍的不理解的话大家参考一下实例代码。

vi /etc/keepalived/keepalived.conf

编辑文件（主）：

    global_defs {  
       router_id nginx_master  
    }  
    #监控服务.NGINX mysql等  
    vrrp_script chk_nginx {  
        script "/usr/local/nginx/check_nginx.sh"  
        interval 2  
        weight 2  
    }  
      
    vrrp_instance VI_1 {  
        state MASTER  
        interface eth0  
        virtual_router_id 51  
        priority 101  
        advert_int 1  
        authentication {  
            auth_type PASS  
            auth_pass 1111  
        }  
        virtual_ipaddress {  
            192.168.xx.xx    #VIP（虚拟ip）
            192.168.xx.xx    #主服务器IP
           192.168.xx.xx    #从服务器IP
} 
track_script { 
chk_nginx #检测脚本 上面配置的 
} 
}

vi /etc/keepalived/keepalived.conf

编辑文件（从）：

global_defs {  
   router_id nginx_backup  
}  
#监控服务.NGINX mysql等  
vrrp_script chk_nginx {  
    script "/usr/local/nginx/check_nginx.sh"  
    interval 2  
    weight 2  
}  
  
vrrp_instance VI_1 {  
    state BACKUP  
    interface eth0  
    virtual_router_id 51  
    priority 99  
    advert_int 1  
    authentication {  
        auth_type PASS  
        auth_pass 1111  
    }  
    virtual_ipaddress {  
192.168.xx.xx    #VIP（虚拟ip）
 192.168.xx.xx    #主服务器IP
 192.168.xx.xx   #从服务器IP
 } 
track_script { 
chk_nginx #检测脚本 上面配置的 
}
 }

启动并测试：

1.启动两台机器上的nginx

2.启动两台机器上的keepalived

此时使用命令 ip addr 查看虚拟IP绑定可以看到主有，从没有，将主机的keepalived关掉，可以看到vip绑定到了从的上面。

使用其他机器访问使用wget进行访问：vip:xx/wget ?userid=20003829

查看是否能够访问，然后让本机的nginx关掉，继续使用wget看是否能够访问，如果能够访问则HA配置成功。

参考地址：

http://www.linuxidc.com/Linux/2012-08/69383.htm

http://www.68idc.cn/help/buildlang/ask/20150616370229.html

http://blog.csdn.net/conquer0715/article/details/47955553

posted on 2016-09-08 19:45 如果蜗牛有爱情阅读(2190) 评论(0) 收藏举报

刷新页面返回顶部

Linux下配置 Keepalived（心跳检测部署）

导航

公告