keepalived
keepalived(高可用软件)
什么是高可用?
拿lvs来举例,我设置的是rr算法,当我用户请求进来,经过调度器,调度器通过算法把请求分给后端RS,如果我后端有一台RS宕机了,那么我调度器是不知道的,还是会一直给它发送报文,而用户时而能收到返回请求,时而收到请求超时,还有一种情况,就是我调度器故障,所谓的单点故障,lvs都是没有办法排除的,它只是一款负载均衡软件。在节点出现故障时,并不影响用户的使用,访问,这种机制就叫高可用。英文名字叫high avalible。
高可用中需要了解的名词:
什么是节点?
运行高可用进程的一个独立主机,称为节点,节点分为主节点(master),备节点(backup),主节点和备节点之间的协议叫VRRP(虚拟路由冗余协议),通过转移ip来实现高可用。
在keepalived中,主节点是实时向它的备节点发送报文,告诉他我还活着,你休想篡位,我死了你才能上位,主节点会每隔多少多少秒告诉他的备节点我还活着,这个时间可以设置。这个告诉的时间要拿捏好,不能太短,也不能太长,备节点可以是多个,当主节点死掉了,备节点靠自身的优先级来上位,优先级越大,就先上位。
keepalived利用checker(监控者)这个组件来检查后端节点的好坏,当后端RS宕机,就会剔除坏的,master因为有leepalived的存在,他就会知道后端RS有宕机的,就不会给宕机的RS发送请求了,只会给正常的RS发送请求。
资源:IP地址
事件:就是集群中可能发生的事情,例如节点故障,网络连通故障,网卡故障都会发生节点资源的转移。
动作:针对事件的发生而产生的动作。
keepalived简介
keepalived 是linux下一个轻量级的高可用解决方案,它与HACMP(IBM研发)实现功能类似,都可以实现服务或者网络的高可用,但是又有差别:hacmp是一个专业的、功能完善的高可用软件,它提供了HA软件所需的基本功能,比如心跳检测和资源接管,检测集群中的系统服务,在集群节点间转移共享ip地址所有者等,hacmp功能强大,但是部署和使用相对麻烦,同时也是商业化软件,与hacmp相比,keepalived主要是通过虚拟路由冗余来实现高可用功能,虽然他没有hacmp功能强大,但是keepalived部署使用相对简单,所有配置只需要一个配置文件即可完成.。
keepalived用途
keepalived起初是为lvs设计的,专门用来监控集群系统中各个服务节点的状态,它根据layer3,4 & 5交换机制检测每个服务节点的状态,如果某个服务节点出现异常,或工作出现故障,keepaived将检测到,并将出现故障的服务节点从集群系统中剔除,而在故障节点恢复正常后,keepalived又可以自动将此服务节点重新加入到集群中,这些工作全部自动完成,不需要人工干预,需要人工完成的只是修复故障节点。
keepalived后来又加入了VRRP 的功能,VRRP是Virtual Router Redundancy Protocol(虚拟路由器冗余协议)的缩写,它出现的目的是为了解决静态路由出现的单点故障问题,通过VRRP可以实现网络不间断的、稳定的运行,因此,keepalived一方面具有服务器状态监测和故障隔离功能,另一方面也具有HA Cluster功能,下面详细介绍下VRRP协议的实现过程
vrrp工作原理
在一个虚拟路由器中,只有处于master角色的路由器会一直发送vrrp数据包,处于backup角色的路由器只接受master发过来的报文信息,用来监控master运行状态,因此,不会发生master抢占的现象,除非它的优先级更高,而当master不可用时,backup也就无法收到master发过来的报文信息,于是就认定master出现故障,接着多台backup就会进行选举,优先级最高的backup将成为新的master,这种选举并进行角色的过程非常快,因此也就保证了服务的持续可用性。
keepalived体系结构
可以看出来,keepalived的体系结构从整体上分为两层,分别是用户空间层和内核空间层。下面介绍一个keepalived两层结构的详细组成及实现的功能。
内核空间层处于最底层,它包括ipvs和netlink两个模块。ipvs模块是keepalived引入的一个第三方模块,通过ipvs可以实现基于ip的负载均衡集群。ipvs默认包含在lvs集群软件中。
这里有一个误区,由于keepalived可以和ipvs一起很好的工作,所以很多初学者都认为keepalived是一个负载均衡的软件,这种理解是错误的
内核模块:
IPVS:主要用于通过IPVS跟lvs进行整合,是lvs的核心模块,跟lvs一块使用的
NETLINK:主要实现一些网络的功能
用户模块:主要用于高可用
checker:检查服务状态
vrrp stack:用于DS高可用
keepalived的安装与配置
#先基于的情况是单点故障 #mask端的配置: yum install keepalived #主配置文件: /etc/keepalived/keepalived.conf #分为三段: global全局、vrrp、virtual_server虚拟主机 #只留vrrp的,其余的都注释掉,global的只注释里面的内容。 #而后修改vrrp: ! Configuration File for keepalived global_defs { notification_email { } } vrrp_instance VI_1 { state MASTER interface ens33 #要监控的网络端口 virtual_router_id 51 #虚拟路由的ID,master跟backup要一样,证明他俩是在同一个虚拟网络>里面 priority 100 #优先级 advert_int 1 #一秒检查一次 authentication { #认证 auth_type PASS #认证方式 auth_pass 1111 #密码 } virtual_ipaddress { 192.168.24.250 } } #backup端的配置: yum install keepalived –y #打开keepalived配置文件 ! Configuration File for keepalived global_defs { notification_email { } } vrrp_instance VI_1 { state BACKUP interface ens33 #要监控的网络端口 virtual_router_id 51 #虚拟路由的ID,master跟backup要一样,证明他俩是在同一个虚拟网络>里面 priority 99 #优先级 advert_int 1 #一秒检查一次 authentication { #认证 auth_type PASS #认证方式 auth_pass 1111 #密码 } virtual_ipaddress { 192.168.24.250 } } #分别启动master端和backup端的keepalived systemctl start keepalived #如何发生飘移:只需停掉keepalived服务即可。
互为主备
就是说master在提供服务时候,backup是充当了一个冷备,这是对系统资源的一种浪费。如何实现两台机器即是master又是backup。就是互为主备。
比如我去访问www.wuyuetian.com这个域名的时候,它是对应的多个IP,什么意思,我有两台服务器,他俩的IP是不一样的,但对外提供的服务是一样的,都是提供www.wuyuetian.com这个web服务,那么给这两台服务器做keepalived,让他俩互为主备,如果我的一台服务器宕机,那么,宕机服务器的IP会漂移到正常的上面,正常,另一台就有了两个IP。
! Configuration File for keepalived global_defs { notification_email { } } vrrp_instance VI_1 { state MASTER interface ens33 virtual_router_id 51 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.24.250 } } vrrp_instance VI_2 { #此处修改,不能跟v1重名 state BACKUP #此处修改 interface ens33 virtual_router_id 52 #此处修改 priority 99 #此处修改 advert_int 1 authentication { auth_type PASS auth_pass 2222 #此处修改 } virtual_ipaddress { 192.168.24.200 #服务IP修改 } } ! Configuration File for keepalived notification_email { } } vrrp_instance VI_1 { state BACKUP interface ens33 virtual_router_id 51 priority 99 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.24.250 } } vrrp_instance VI_2 { #此处修改,不能跟v1重名 state MASTER #此处修改 interface ens33 virtual_router_id 52 #此处修改 priority 100 #此处修改 advert_int 1 authentication { auth_type PASS auth_pass 2222 #此处修改 } virtual_ipaddress { 192.168.24.200 #服务IP修改 } }
不抢占模式
在互为主备的情况下,对于业务来说,第一次宕机,发生了切换,那么主节点好了,IP又漂移了回来,又发生了一次切换,第一次是因为故障发生切换,是正常的,那么第二次,就是可控制的,这就是让他不抢占。
! Configuration File for keepalived global_defs { } vrrp_instance VI_1 { state BACKUP #此处修改,纯靠优先级决定 interface ens33 virtual_router_id 51 priority 100 advert_int 1 nopreempt #非抢占模式 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.24.250 } } vrrp_instance VI_2 { #此处修改,不能跟v1重名 state BACKUP #此处修改 interface ens33 virtual_router_id 52 #此处修改 priority 99 #此处修改 advert_int 1 authentication { auth_type PASS auth_pass 2222 #此处修改 } virtual_ipaddress { 192.168.24.200 #服务IP修改 } }
real server宕机
我们之前说过,keepalived是利用checker这个组建实现调度器监控后端RS,当后端RS宕机后,就不在给它发送报文,并把它剔除出去,现在我们来做一下这个实验。
#首先配置后端RS,后端RS需配置lvs。 #!/bin/bash case $1 in start) echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce ifconfig ens33:0 192.168.24.250/32 broadcast 192.168.24.250 up if [ $? -eq 0 ];then route add -host 192.168.24.250 dev ens33:0 fi echo "ok" ;; stop) echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce ifconfig ens33:0 down route del -host 192.168.24.250 echo "lose" ;; *) echo "go away" ;; esac #而后配置keepalived,把virtual_server段注释解开,需配置在24.250虚IP的主节点上。 virtual_server 192.168.24.250 80 { #此处修改为后端RS的VIP和他的网站端口 delay_loop 3 #健康检查时间间隔 lb_algo rr lb_kind DR protocol TCP real_server 192.168.24.10 80 { #此出为后端RSIP和80端口 weight 1 #权重 HTTP_GET { #协议 url { path / status_code 200 } connect_timeout 3 #连接超时时间 nb_get_retry 3 #重连次数 delay_before_retry 3 #重连时间间隔 } } real_server 192.168.24.11 80 { #此出为后端RSIP和80端口 weight 1 #权重 HTTP_GET { #协议 url { path / status_code 200 } connect_timeout 3 #连接超时时间 nb_get_retry 3 #重连次数 delay_before_retry 3 #重连时间间隔 } } } #重新启动keepalived,使用ipvsadm查看是否添加成功 #后端RS启动httpd,使用windows抓取网页 systemctl start httpd curl 192.168.24.250 #而后停掉后端RS中的任意一台的httpd systemctl stop httpd #等待一下,再抓取网页,只会抓取到一台的,而且使用ipvsadm查看,停掉的那台已经被剔除了。 ipvsadm –L –n #当我重启或恢复,那么就会自动把它添加回去