keepalived

keepalived（高可用软件）

什么是高可用？

拿lvs来举例，我设置的是rr算法，当我用户请求进来，经过调度器，调度器通过算法把请求分给后端RS，如果我后端有一台RS宕机了，那么我调度器是不知道的，还是会一直给它发送报文，而用户时而能收到返回请求，时而收到请求超时，还有一种情况，就是我调度器故障，所谓的单点故障，lvs都是没有办法排除的，它只是一款负载均衡软件。在节点出现故障时，并不影响用户的使用，访问，这种机制就叫高可用。英文名字叫high avalible。

高可用中需要了解的名词：

什么是节点？

　　运行高可用进程的一个独立主机，称为节点，节点分为主节点（master），备节点（backup），主节点和备节点之间的协议叫VRRP（虚拟路由冗余协议），通过转移ip来实现高可用。

　　在keepalived中，主节点是实时向它的备节点发送报文，告诉他我还活着，你休想篡位，我死了你才能上位，主节点会每隔多少多少秒告诉他的备节点我还活着，这个时间可以设置。这个告诉的时间要拿捏好，不能太短，也不能太长，备节点可以是多个，当主节点死掉了，备节点靠自身的优先级来上位，优先级越大，就先上位。

　　keepalived利用checker（监控者）这个组件来检查后端节点的好坏，当后端RS宕机，就会剔除坏的，master因为有leepalived的存在，他就会知道后端RS有宕机的，就不会给宕机的RS发送请求了，只会给正常的RS发送请求。

资源：IP地址

事件：就是集群中可能发生的事情，例如节点故障，网络连通故障，网卡故障都会发生节点资源的转移。

动作：针对事件的发生而产生的动作。

keepalived简介

　　keepalived 是linux下一个轻量级的高可用解决方案，它与HACMP（IBM研发）实现功能类似，都可以实现服务或者网络的高可用，但是又有差别：hacmp是一个专业的、功能完善的高可用软件，它提供了HA软件所需的基本功能，比如心跳检测和资源接管，检测集群中的系统服务，在集群节点间转移共享ip地址所有者等，hacmp功能强大，但是部署和使用相对麻烦，同时也是商业化软件，与hacmp相比，keepalived主要是通过虚拟路由冗余来实现高可用功能，虽然他没有hacmp功能强大，但是keepalived部署使用相对简单，所有配置只需要一个配置文件即可完成.。

keepalived用途

　　keepalived起初是为lvs设计的，专门用来监控集群系统中各个服务节点的状态，它根据layer3,4 & 5交换机制检测每个服务节点的状态，如果某个服务节点出现异常，或工作出现故障，keepaived将检测到，并将出现故障的服务节点从集群系统中剔除，而在故障节点恢复正常后，keepalived又可以自动将此服务节点重新加入到集群中，这些工作全部自动完成，不需要人工干预，需要人工完成的只是修复故障节点。

　　keepalived后来又加入了VRRP 的功能，VRRP是Virtual Router Redundancy Protocol（虚拟路由器冗余协议）的缩写，它出现的目的是为了解决静态路由出现的单点故障问题，通过VRRP可以实现网络不间断的、稳定的运行，因此，keepalived一方面具有服务器状态监测和故障隔离功能，另一方面也具有HA Cluster功能，下面详细介绍下VRRP协议的实现过程

vrrp工作原理

　　在一个虚拟路由器中，只有处于master角色的路由器会一直发送vrrp数据包，处于backup角色的路由器只接受master发过来的报文信息，用来监控master运行状态，因此，不会发生master抢占的现象，除非它的优先级更高，而当master不可用时，backup也就无法收到master发过来的报文信息，于是就认定master出现故障，接着多台backup就会进行选举，优先级最高的backup将成为新的master，这种选举并进行角色的过程非常快，因此也就保证了服务的持续可用性。

keepalived体系结构

　　可以看出来，keepalived的体系结构从整体上分为两层，分别是用户空间层和内核空间层。下面介绍一个keepalived两层结构的详细组成及实现的功能。

内核空间层处于最底层，它包括ipvs和netlink两个模块。ipvs模块是keepalived引入的一个第三方模块，通过ipvs可以实现基于ip的负载均衡集群。ipvs默认包含在lvs集群软件中。

　　这里有一个误区，由于keepalived可以和ipvs一起很好的工作，所以很多初学者都认为keepalived是一个负载均衡的软件，这种理解是错误的

内核模块:

IPVS:主要用于通过IPVS跟lvs进行整合，是lvs的核心模块，跟lvs一块使用的

NETLINK:主要实现一些网络的功能

用户模块:主要用于高可用

checker:检查服务状态

vrrp stack:用于DS高可用

keepalived的安装与配置

#先基于的情况是单点故障

#mask端的配置：

yum install keepalived

#主配置文件：

/etc/keepalived/keepalived.conf

#分为三段：

global全局、vrrp、virtual_server虚拟主机

#只留vrrp的，其余的都注释掉，global的只注释里面的内容。

#而后修改vrrp：

! Configuration File for keepalived

global_defs {

   notification_email {

   }  

}

vrrp_instance VI_1 {

    state MASTER

    interface ens33  #要监控的网络端口

    virtual_router_id 51  #虚拟路由的ID,master跟backup要一样，证明他俩是在同一个虚拟网络>里面

    priority 100  #优先级

    advert_int 1  #一秒检查一次

    authentication {   #认证

        auth_type PASS  #认证方式

        auth_pass 1111  #密码

    }  

    virtual_ipaddress {

        192.168.24.250

    }  

}

#backup端的配置：

yum install keepalived –y

#打开keepalived配置文件

! Configuration File for keepalived

global_defs {

   notification_email {

   }  

}

vrrp_instance VI_1 {

    state BACKUP

    interface ens33  #要监控的网络端口

    virtual_router_id 51  #虚拟路由的ID,master跟backup要一样，证明他俩是在同一个虚拟网络>里面

    priority 99  #优先级

    advert_int 1  #一秒检查一次

    authentication {   #认证

        auth_type PASS  #认证方式

        auth_pass 1111  #密码

    }  

    virtual_ipaddress {

        192.168.24.250

    }  

}

#分别启动master端和backup端的keepalived

systemctl start keepalived

#如何发生飘移：只需停掉keepalived服务即可。

互为主备

　　就是说master在提供服务时候，backup是充当了一个冷备，这是对系统资源的一种浪费。如何实现两台机器即是master又是backup。就是互为主备。

比如我去访问www.wuyuetian.com这个域名的时候，它是对应的多个IP，什么意思，我有两台服务器，他俩的IP是不一样的，但对外提供的服务是一样的，都是提供www.wuyuetian.com这个web服务，那么给这两台服务器做keepalived，让他俩互为主备，如果我的一台服务器宕机，那么，宕机服务器的IP会漂移到正常的上面，正常，另一台就有了两个IP。

! Configuration File for keepalived

 

global_defs {

   notification_email {

   }

}

 

vrrp_instance VI_1 {

    state MASTER

    interface ens33 

    virtual_router_id 51 

    priority 100 

    advert_int 1  

    authentication {  

        auth_type PASS 

        auth_pass 1111 

    }  

    virtual_ipaddress {

        192.168.24.250

    }  

}

vrrp_instance VI_2 {  #此处修改，不能跟v1重名

    state BACKUP  #此处修改

    interface ens33 

    virtual_router_id 52  #此处修改

    priority 99 #此处修改 

    advert_int 1  

    authentication {  

        auth_type PASS 

        auth_pass 2222  #此处修改 

    }  

    virtual_ipaddress {

        192.168.24.200 #服务IP修改

    }

}

 

 

! Configuration File for keepalived

 

   notification_email {

   }

} 

 

vrrp_instance VI_1 {

    state BACKUP

    interface ens33

    virtual_router_id 51

    priority 99 

    advert_int 1

    authentication {

        auth_type PASS

        auth_pass 1111 

    }  

    virtual_ipaddress {

        192.168.24.250

    }  

}  

vrrp_instance VI_2 {  #此处修改，不能跟v1重名

    state MASTER  #此处修改

    interface ens33 

    virtual_router_id 52  #此处修改

    priority 100 #此处修改  

    advert_int 1   

    authentication {

        auth_type PASS

        auth_pass 2222  #此处修改

    }  

    virtual_ipaddress {

        192.168.24.200 #服务IP修改

    }  

}

不抢占模式

　　在互为主备的情况下，对于业务来说，第一次宕机，发生了切换，那么主节点好了，IP又漂移了回来，又发生了一次切换，第一次是因为故障发生切换，是正常的，那么第二次，就是可控制的，这就是让他不抢占。

! Configuration File for keepalived

global_defs {

} 

 

vrrp_instance VI_1 {

    state BACKUP #此处修改，纯靠优先级决定

    interface ens33 

    virtual_router_id 51

    priority 100 

    advert_int 1 

    nopreempt  #非抢占模式

    authentication {   

        auth_type PASS 

        auth_pass 1111 

    }  

    virtual_ipaddress {

        192.168.24.250

    }  

}  

vrrp_instance VI_2 {  #此处修改，不能跟v1重名

    state BACKUP  #此处修改

    interface ens33 

    virtual_router_id 52  #此处修改

    priority 99 #此处修改 

    advert_int 1  

    authentication {

        auth_type PASS

        auth_pass 2222  #此处修改

    }  

    virtual_ipaddress {

        192.168.24.200 #服务IP修改

    }  

}

real server宕机

我们之前说过，keepalived是利用checker这个组建实现调度器监控后端RS，当后端RS宕机后，就不在给它发送报文，并把它剔除出去，现在我们来做一下这个实验。

#首先配置后端RS，后端RS需配置lvs。

#!/bin/bash

case $1 in

start)

    echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore

    echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore

    echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce

    echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce

    ifconfig ens33:0 192.168.24.250/32 broadcast 192.168.24.250 up

    if [ $? -eq 0 ];then

        route add -host 192.168.24.250 dev ens33:0

    fi 

        echo "ok"

;;

stop)

    echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore

    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore

    echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce

    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce

    ifconfig ens33:0 down

    route del -host 192.168.24.250

        echo "lose"

;;

*)

        echo "go away"

;;

esac

#而后配置keepalived，把virtual_server段注释解开，需配置在24.250虚IP的主节点上。

virtual_server 192.168.24.250 80 { #此处修改为后端RS的VIP和他的网站端口

    delay_loop 3  #健康检查时间间隔

    lb_algo rr

    lb_kind DR

    protocol TCP

   

    real_server 192.168.24.10 80 {  #此出为后端RSIP和80端口

        weight 1   #权重

        HTTP_GET {  #协议

            url {

              path /

              status_code 200

            }  

            connect_timeout 3  #连接超时时间

            nb_get_retry 3   #重连次数

            delay_before_retry 3  #重连时间间隔

        }  

    }  

    real_server 192.168.24.11 80 {  #此出为后端RSIP和80端口

        weight 1   #权重

        HTTP_GET {  #协议

            url {

              path /

              status_code 200

            }  

            connect_timeout 3  #连接超时时间

            nb_get_retry 3   #重连次数

            delay_before_retry 3  #重连时间间隔

        }  

    }  

}  

#重新启动keepalived，使用ipvsadm查看是否添加成功

#后端RS启动httpd，使用windows抓取网页

systemctl start httpd

curl 192.168.24.250

#而后停掉后端RS中的任意一台的httpd

systemctl stop httpd

#等待一下，再抓取网页，只会抓取到一台的，而且使用ipvsadm查看，停掉的那台已经被剔除了。

ipvsadm –L –n

#当我重启或恢复，那么就会自动把它添加回去

posted @ 2019-06-02 11:43 冷漠铁锤王富贵阅读(1339) 评论(0) 编辑收藏举报

刷新页面返回顶部

冷漠铁锤王富贵