keepAlived 安装及配置
1、安装
- yum install keepalived –y
- rpm -qa keepalived
2、启动keepalived服务并检查
- /etc/init.d/keepalived start
- ps -ef|grep keep|grep -v grep #提示:启动后有三个keepalive 进程表示安装正确
- ip add|grep 192.168 #提示:默认情况会启动三个VIP地址
- /etc/init.d/keepalived stop #关闭keepalive服务
3、配置文件说明
- ls -l /etc/keepalived/keepalived.conf 和其他使用yum安装的软件一样,keepalived软件的配置文件默认路径及配置文件名为
- 这里高可用的功能的配置文件包含了两个重要区块,下面分别说明:
4、全局定义部分
全局定义(Global Definitions)部分 这部分主要用来设置keepalived的故障通知机制和Router ID标识。示例配置如下:
head -13 /etc/keepalived/keepalived.conf|cat –n
- 1行 注释,!开头和#开头一样,都是注释
- 3~8 行:定义服务故障报警的Email地址。作用是当服务发生切换或RS节点等有故障时,发报警邮件。这几行是可选配置,notification_email指定在keepalived发生事件时,需要发送的Email地址,可以有多个,每行一个
- 9行 指定发送Email的发送人,即发件人的地址,也是可选 的配置。
- 10行 smtp_server 指定发送邮件的smtp服务器,如果本机开启了sedmail或postfix,就可以使用上面默认配置实现邮件发送,也是可选 配置
- 11行 smtp_connect_timeout 是连接smtp超时时间,也是可选配置
注:第4~11行所有和邮件报警相关的参数都可以不配置,在实际工作中会将监控的任务交给更加擅长监控报警的Nagios或Zabbix软件。
- 12行 keepalived服务器的路由标识(router_id).在一个局域网内,这个标识应该是唯一 的。大括号 {} 用来分隔区块,要成对出现 。如查漏了半个大括号,keepalived不会报错,但是也不会得到想要的效果。另外由于区块间存在多层嵌套关系,所以很容易遗漏区块结尾外的大括号。
5、VRRP实例定义区块(VRRP instance(s))部分
这部分主要用来定义具体服务的实例配置,包括keepalive主备状态,接口、优先级、认证方式和IP信息等。配置如下:
- 15行 表示定义一个vrrp_instance实例,名字是VI_1,每个vrrp_instance 实例可以认为是keepalived服务的一个实例或者作为一个业务服务,在keepalived服务配置中,这样的vrrp_instance实例可以多个。注意,存在于主节点中的vrrp_instance 实例在备节点中也要存在,这样才能实现故障切换接管。
- 16行 state MASTER 表示当前实例VI_1的角色状态,当前角色是MASTER,这个状态只能有MASTER 和 BACKUP 两种状态,并且需要大写这些字符。其中MASTER为正式工作的状态,BACKUP为备用工作状态。当MASTER所在的服务器故障或失效时,BACKUP 所在的服务器会接管故障的MASTER 继续提供服务。
- 17行 interface 为网络通信接口。为对外提供服务的网络接口,如eht0、eht1、。当前主流的服务器都有2~4 个网络接口,在选择服务接口时,要搞清楚了。
- 18行 virtual_router_id 为虚拟路由ID标识,这个标识最好是一个数字,并且要在一个keepalived.conf 配置中是唯一 的,但是MASTER 和BACKUP 配置中相同实例的virtual_router_id 又必须一致,否则出现脑裂问题。
- 19行 priority 为优先级,其后面的数值也是一个数字,数字越大,表示实例优先级越高。在同一个vrrp_instance实例里,MASTER 的优先级配置要高于 BACKUP的。或主机的priority 值为150 ,那么备机的 prioriry必须要少于150,一般建议间隔50以上为佳。
- 20行 advert_int 为同步通知间隔。主机与备机之间通信检查的时间间隔,单位为秒默认为1
- 21~24行 authentication 为权限认证配置,包含认证类型(auth_type)和认证密码(auth_pass)。认证类型有PASS、AH、两种,官方推荐为PASS 。验证密码为明文方式,最好长度不要超过8个字符,建议用4位的数字,同一vrrp实例的主机和备机使用相同的密码才能正常通信。
- 25~29行 virtual_ipaddress 为虚拟IP地址。可以配置多个Ip地址,每个地址占一行,配置时最好明确指定子网掩码以及虚拟IP 绑定的网络接口。否则子网掩码默认是32为,绑定的接口和前面的insterface参数配置的一致。注意,这里的虚拟IP是在工作中需要和域名绑定的iP,即和配置的高可用服务监听的IP要保持一
以下内容转载自:https://www.cnblogs.com/along1226/p/5027838.html
6、配置文件详解
第一部分:全局定义块
1、email通知。作用:有故障,发邮件报警。
2、Lvs负载均衡器标识(lvs_id)。在一个网络内,它应该是唯一的。
3、花括号“{}”。用来分隔定义块,因此必须成对出现。如果写漏了,keepalived运行时,不会得到预期的结果。由于定义块内存在嵌套关系,因此很容易遗漏结尾处的花括号,这点要特别注意。global_defs { notification_email { #指定keepalived在发生切换时需要发送email到的对象,一行一个 sysadmin@fire.loc } notification_email_from Alexandre.Cassen@firewall.loc #指定发件人 smtp_server localhost #指定smtp服务器地址 smtp_connect_timeout 30 #指定smtp连接超时时间 router_id LVS_DEVEL #运行keepalived机器的一个标识 }
vrrp_script chk_http_port {
script "/data/script/nginx.sh" #监控服务脚步
interval 2 #检测时间间隔(执行脚步间隔)
weight 2
}
第二部分:vrrp_sync_group作用:确定失败切换(FailOver)包含的路由实例个数。即在有2个负载均衡器的场景,一旦某个负载均衡器失效,需要自动切换到另外一个负载均衡器的实例是哪些? 实例组group{}至少包含一个vrrp实例vrrp_sync_group VG_1{ #监控多个网段的实例 group { VI_1 #实例名 VI_2 ...... } notify_master /path/xx.sh #指定当切换到master时,执行的脚本 netify_backup /path/xx.sh #指定当切换到backup时,执行的脚本 notify_fault "path/xx.sh VG_1" #故障时执行的脚本 notify /path/xx.sh smtp_alert #使用global_defs中提供的邮件地址和smtp服务器发送邮件通知 }
第三部分:vrrp_instance,实例名出自实例组group所包含的那些名字。vrrp_instance VI_1 { state BACKUP #指定那个为master,那个为backup,如果设置了nopreempt这个值不起作用,主备考priority决定 interface eth0 #设置实例绑定的网卡 dont_track_primary #忽略vrrp的interface错误(默认不设置) track_interface{ #设置额外的监控,里面那个网卡出现问题都会切换 eth0 eth1 } mcast_src_ip #发送多播包的地址,如果不设置默认使用绑定网卡的primary ip garp_master_delay #在切换到master状态后,延迟进行gratuitous ARP请求 virtual_router_id 50 #VPID标记 priority 99 #优先级,高优先级竞选为master advert_int 1 #检查间隔,默认1秒 nopreempt #设置为不抢占 注:这个配置只能设置在backup主机上,而且这个主机优先级要比另外一台高 preempt_delay #抢占延时,默认5分钟 debug #debug级别
track_interface { #监控的网卡。如果只监控服务,这里可以不填
eth1
}
authentication { #设置认证 auth_type PASS #认证方式 auth_pass 111111 #认证密码 } virtual_ipaddress { #设置vip 192.168.202.200 }track_script { #以脚本为监控chk_http_port是前面填写的
chk_http_port#p#分页标题#e#
}#检测脚本一定要写在vrrp_instance的前面也就是上面,而且花括号一定要有空格,追踪trace_script要定在vip的后面,多少人栽在了这上面好多小时 }
第四部分: 虚拟服务器virtual_server定义块 ,虚拟服务器定义是keepalived框架最重要的项目了,是keepalived.conf必不可少的部分。 该部分是用来管理LVS的,是实现keepalive和LVS相结合的模块。ipvsadm命令可以实现的管理在这里都可以通过参数配置实现,注意:real_server是被包含在viyual_server模块中的,是子模块。
virtual_server 192.168.202.200 23 { #VIP地址,要和vrrp_instance模块中的virtual_ipaddress地址一致 delay_loop 6 #健康检查时间间隔 lb_algo rr #lvs调度算法rr|wrr|lc|wlc|lblc|sh|dh lb_kind DR #负载均衡转发规则NAT|DR|RUN persistence_timeout 5 #会话保持时间 protocol TCP #使用的协议 persistence_granularity <NETMASK> #lvs会话保持粒度 virtualhost <string> #检查的web服务器的虚拟主机(host:头) sorry_server<IPADDR> <port> #备用机,所有realserver失效后启用 real_server 192.168.200.5 23 { #RS的真实IP地址 weight 1 #默认为1,0为失效 inhibit_on_failure #在服务器健康检查失效时,将其设为0,而不是直接从ipvs中删除 notify_up <string> | <quoted-string> #在检测到server up后执行脚本 notify_down <string> | <quoted-string> #在检测到server down后执行脚本 } TCP_CHECK { #常用 connect_timeout 3 #连接超时时间 nb_get_retry 3 #重连次数 delay_before_retry 3 #重连间隔时间 connect_port 23 #健康检查的端口的端口 bindto <ip> } HTTP_GET | SSL_GET{ #不常用 url{ #检查url,可以指定多个 path / digest <string> #检查后的摘要信息 status_code 200 #检查的返回状态码 } connect_port <port> bindto <IPADD> connect_timeout 5 nb_get_retry 3 delay_before_retry 2 } SMTP_CHECK{ #不常用 host{ connect_ip <IP ADDRESS> connect_port <port> #默认检查25端口 bindto <IP ADDRESS> } connect_timeout 5 retry 3 delay_before_retry 2 helo_name <string> | <quoted-string> #smtp helo请求命令参数,可选 } MISC_CHECK{ #不常用 misc_path <string> | <quoted-string> #外部脚本路径 misc_timeout #脚本执行超时时间 misc_dynamic #如设置该项,则退出状态码会用来动态调整服务器的权重,返回0 正常,不修改;返回1,检查失败,权重改为0;返回2-255,正常,权重设置为:返回状态码-2 } }线上配置文件
View Code[root@LB2 ~]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalived global_defs { notification_email { 49000448@qq.com } notification_email_from Alexandre.Cassen@firewall.loc smtp_server 10.0.0.1 smtp_connect_timeout 30 router_id LVS_2 } vrrp_instance VI_1 { state BACKUP interface eth0 virtual_router_id 55 priority 100 advert_int 1 authentication { auth_type PASS auth_pass 1111 } virtual_ipaddress { 192.168.220.110/24 } } virtual_server 192.168.220.110 80 { delay_loop 6 lb_algo wrr lb_kind DR nat_mask 255.255.255.0 persistence_timeout 300 protocol TCP } real_server 192.168.220.129 80 { weight 1 TCP_CHECK { connect_timeout 8 nb_get_retry 3 delay_before_retry 3 connect_port 80 } } } real_server 192.168.220.138 80 { weight 1 TCP_CHECK { connect_timeout 8 nb_get_retry 3 delay_before_retry 3 connect_port 80 } }
7、修改keepalive日志文件
- 默认keepalive的日志文件是 /var/log/messages
- 修改为:
[root@LB2 ~]# vim /etc/sysconfig/keepalived ...... #KEEPALIVED_OPTIONS="-D" //注释掉行 KEEPALIVED_OPTIONS="-D -d -S 0" //添加行 ......[root@LB2 ~]# vim /etc/rsyslog.conf ...... local0.* /var/log/keepalived.log //添加行
在约第42行信息末尾加入:;local0.none
变为:*.info;mail.none;authpriv.none;cron.none;local0.none /var/log/messages
以上配置是表示来自local0设备的所有日志信息不再记录于/var/log/messages 里[root@LB2 ~]# /etc/init.d/rsyslog restart //重启日志服务 [root@LB2 ~]# /etc/init.d/keepalived restart //重启keepalive服务