Linux keepalived工作原理
keepalived简介与工作原理
Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
keepalived工作在IP/TCP协议栈的IP层,TCP层,及应用层,工作原理基于VRRP协议。
网络层(layer 3):Keepalived会定期向服务器群中的服务器发送一个ICMP的数据包,(既我们平时用的Ping程序),如果发现某台服务的IP地址没有激活,Keepalived便报告这台服务器失效,并将它从服务器群中剔除。
传输层(layer 4):Keepalived以TCP端口的状态来决定服务器工作正常与否,如web server的服务端口一般是80,如果Keepalived检测到80端口没有启动,则Keepalived将把这台服务器从服务器群中剔除。
应用层(layer 5):只要针对应用上的一些探测方式,如URL的get请求,或者对nginx脚本检测等;可以根据用户自定义添加脚本针对特定的服务进行状态检测,当检测结果与用户设定不一致,则把这台服务器从服务器群中剔除。
VRRP协议与工作原理
VRRP(Virtual Router Redundancy Protocol)虚拟路由冗余协议是一种容错的主备模式的协议,当网络设备发生故障时,可以不影响主机之间通信情况下进行设备切换,并且相对用户时切换过程时透明的。
路由器开启VRRP功能后,会根据优先级确定自己在备份组中的角色。优先级高的路由器成为主用路由器,优先级低的成为备用路由器。主用路由器拥有虚拟IP与虚拟MAC,实现各种网络功能,并发送VRRP通告报文,通知备用路由器组内的其他路由器自己工作正常;备用路由器则启动定时器等待通告报文。抢占模式下,当备用路由器收到VRRP通告报文后,会将自己的优先级与通告报文中的优先级进行比较。如果大于通告报文中的优先级,则成为主用路由器;否则将保持备用状态。非抢占模式下,只要主用路由器不发生故障,就算备用路由器的优先级再高,也始终保持备用状态。如果备用路由器的定时器超时后仍未收到主用路由器发送来的VRRP通告报文,则认为主用路由器已经无法正常工作,备份组内的路由器根据优先级选举出主用路由器。
- 一个VRRP路由器有唯一的标识:VRID,范围为0—255。该路由器对外表现为唯一的虚拟MAC地址,地址的格式为00-00-5E-00-01-[VRID]。
- 同一台路由器可以加入多个备份组,在不同备份组中有不同的优先级,使得该路由器可以在一个备份组中作为主用路由器,在其他的备份组中作为备用路由器。
- 提供了两种安全认证措施:明文认证和IP头认证。
VRRP选举机制
- 虚拟IP拥有者,如果某台路由器的IP地址与虚拟路由器的VIP地址一致,那么这台就会被选为主用路由器。
- 优先级较高者,如果没有虚拟IP拥有者,优先级数值大的路由器会被选举出,优先级范围0~255。
- IP地址较大者,如果优先级一样高,IP地址数值大的路由器会被选举出。
keepalived配置组成
global_defs是对全局一些参数做出设置。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
|
global_defs { notification_email { # 接受邮件地址 sysadmin@firewall.loc } notification_email_from master@keepalived.com # 邮件头地址 smtp_server 192.168.200.1 # 邮件服务smtp地址 smtp_connect_timeout 30 # smtp连接超时时间 router_id LVS_DEVEL # 本地机器的id,可以为本地主机名 vrrp_skip_check_adv_addr # 检查收到的通告中的所有地址会非常耗时,设置此参数就不会检查收到过的主路由器的通告 vrrp_strict # 严格遵守VRRP协议,开启这个功能会在iptables中添加下面一条规则,导致VIP ping不通 # Chain INPUT (policy ACCEPT) # target prot opt source destination # DROP all -- 0.0.0.0/0 172.30.100.200 vrrp_garp_interval 0 # 一个网卡上每组gratuitous arp消息之间的延迟时间,默认为0 vrrp_gna_interval 0 # 一个网卡上每组na消息之间的延迟时间,默认为0 vrrp_iptables # 设置此项则不会开启任何iptables规则 vrrp_mcast_group4 224.0.0.18 # 主备间通告状态信息的组播地址,通常为224网段 } |
vrrp_script只是定义一个对集群服务的健康状态检测脚本,并根据监控的结果状态能实现优先动态调整;这种方式在做高可用nginx或者haproxy时需要用到。
1
2
3
4
5
6
7
8
|
vrrp_script chk_nginx { script # 添加要定期执行的检测脚本,它的退出代码将被记录在监视它的所有VRRP实例中 interval 2 # 两次脚本调用的间隔,默认为1秒 weight -20 # 如果检测条件成立,权重-20 } |
vrrp_instance是虚拟路由实例的配置段,用来定义当前keepalived节点的运行角色为主或是备,定义当前节点的优先级,设置虚拟IP等信息。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
vrrp_instance VI_1 { # 定义虚拟路由器,实例名称VI_1主备必须相同 state MASTER # 定义此节点为MASTER interface eth0 # 绑定为当前虚拟路由器使用的物理接口 virtual_router_id 51 # 设置虚拟路由id,范围0~255,主备必须相同 priority 100 # 设置此节点优先级 advert_int 1 # 设置主备节点间vrrp通告状态的时间间隔 authentication { # 设置主备间验证方式 auth_type PASS auth_pass 1111 } virtual_ipaddress { # 设置虚拟路由VIP 172.30.200.1 } track_script { # 添加监控脚本,脚本名为vrrp_script中定义的脚本 chk_nginx } } |
virtual_server中定义了LVS工作模式及调度算法等信息,real_server则是定义后端的真实服务器。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
|
virtual_server 172.30.200.1 80 { # 定义虚拟主机IP与端口 delay_loop 6 # 健康状态检测时间间隔 lb_algo rr # lvs调度算法 lb_kind NAT # lvs工作类型 persistence_timeout 50 # lvs持久连接超时时间 protocol TCP # 定义服务协议 sorry_server 172.30.10.14 80 # 当后端所有主机不可达时,就会被定义这台主机,只是为了展示sorry页面 real_server 172.30.10.12 80 { # 配置后端主机 weight 1 # 调度权重 HTTP_GET { # 应用层检测 url { path /testurl/test .jsp # 定义被检测的URL status_code 200 # 判断上述URL健康状态的响应码 digest 640205b7b0fc66c1ea91c463fac6334d # 判断上述URL健康状态的内容的hash码 } connect_timeout 3 # 检测连接的超时时间 nb_get_retry 3 # 重试次数 delay_before_retry 3 # 重试前等待时间 } TCP_CHECK { connect_ip 172.30.10.12 # 选择要连接的IP地址。默认值为realserver IP connect_port 80 # 选择要连接的端口。默认值为realserver PORT bindto 172.30.10.11 # 用于发起连接的可选源地址 bind_port 10000 # 用于发起连接的可选源端口 connect_timeout 3 # 连接超时时间 } } real_server 172.30.10.12 80 { weight 1 HTTP_GET { url { path /testurl/test .jsp digest 640205b7b0fc66c1ea91c463fac6334c } connect_timeout 3 nb_get_retry 3 delay_before_retry 3 } } } |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现