一文搞懂LVS负载均衡工作原理
LVS(Linux Virtual Server)是企业中常用的负载均衡方案,是一种基于Linux 虚拟服务器,也是Linux标准内核的一部分。 它能够实现高性能、高可用的服务器集群,具有良好可靠性、可扩展性和可操作性。
说白了: LVS就是在计算机网络中,利用Linux虚拟服务器的作为一种媒介,实现请求的负载均衡策略。
LVS常用的工作模式主要有:NAT模式、DR模式、TUN模式。
首先,明确一些LVS工作中的一些专业术语。
NAT模式
NAT(Network Address Translation)是一种外网和内网地址映射的工作模式。NAT 模式下,数据包的进出都要经过 LVS 的处理,LVS 作为后端服务器的网关。我们将数据包的发送和响应过程进行拆解,分别说明。
请求过程
- 客户端发送一个数据包,报头包含数据、源IP和目的IP。源IP是客户端PC的IP地址,目的IP是LVS服务器的IP地址。即:数据的寄件人是客户端,收件人是lvs服务器。
- 当lvs服务器收到数据后,会通过自身的负载均衡策略(轮询、加权轮询等)选中了IDC里面的一台ip地址为RIP的服务器去处理。
- lvs服务器会将数据包的目的ip从自己的ip更换为服务器的ip地址(VIP-->RIP),源ip地址保持不变,将数据包发出。
- 后端服务器接收到数据包,进行任务处理。
当服务器处理完任务后,进入响应的过程。
响应过程
- 后端服务器将数据包的源ip和目的ip对调,响应时的数据包源ip为RIP,目的ip为CIP。对调后,数据发送回lsv服务器。
- lvs服务器接收到数据后,目标ip不变,将源ip更换为自己的ip(VIP),然后将数据返回给客户端。
由此可见,nat模式下lvs服务器充当了中间商的角色,后端服务器对客户端透明(不可见)。这样的工作模式扩展性不好,因为:当服务器节点过多时,所有的请求和应答都经过负载均衡器。此时,大量的数据包都交汇在lvs,效率就会变得非常低。
DR模式
相对于nat模式,直接路由(Direct routing)模式做了一些优化,效率更高一些。负载均衡器和后端服务器使用同一个IP对外服务,但只有DR对ARP请求进行响应,所有后端服务器(RS)对源IP的ARP请求保持静默。
- 客户端以ARP消息的方式通过网络发送数据给lvs服务器和RIP服务器。由于后端服务器对ARP消息静默,所以,只有lvs服务器处理该消息;
- lvs服务器根据调度算法,将数据包分发给众多后端服务器中的一台。然后将数据包中的源mac地址保留,目的mac地址改成后端服务器的mac地址,发给RIP服务器。
- RS收到数据包后进行处理,由于IP一致,处理后直接将数据返给客户端。
TUN模式
隧道(TUN)模式下,负载均衡器把客户端发来的数据包,封装一个新的IP头标记(仅目的IP)发给RS,RS收到后先把数据包的头解开,还原数据包。RS处理后直接返回给客户端,不需要再经过负载均衡器。整个请求、响应的流程跟DR模式一样的,不多做赘述。
需要注意的是: 由于RS需要对负载均衡器发过来的数据包进行还原,一定要支持IP TUNNEL协议才可以。隧道模式的RS节点需要合法IP,这种方式需要所有的服务器支持"TP Tunneling(IP Encapsulation)协议。
与DR模式相比,TUN模式有IP隧道的开销,对集群中的后端服务器也必要必须支持IP隧道协议。效率上来讲,还是DR更胜一筹。
总结
以上是计算机组网中lvs负载均衡常用的NAT、DR、TUN模式。从效率上来讲,DR>TUN>NAT。DR模式也是lvs负载均衡中应用最多的一种类型。除此之外还有full-nat模式,原理与nat模式类似,应用较少。