LVS总结
一, LVS介绍
LVS linux virtual server 即linux虚拟服务器,是由章文嵩博士主导的开源负载均衡项目,目前LVS已经被集成到Linux内核模块中.
集群: 将多个服务器集中起来,组成高速互联的计算机组,对访问需求提供同一种服务,并以单一系统的模式加以管理.集群的核心技术是任务调度,并且在付出低成本的情况下,可以获得在性能,可靠性,灵活性方面相对较高的收益.
目的: 性能提高; 成本降低; 可扩展集群节点; 可靠性增强.
分类:HPC,LB,HA
1.高性能集群; Highperformance computing,缩写HPC
2.负载均衡集群; load balance ,缩写LB
3.高可用; HighAvailability ,缩写HA
三层架构: 前段,中间,后端
前端:负载均衡层,由一台或多台负载调度器构成;
中间:服务器群组层,由一组实际运行应用服务的服务器组成;
后端:数据共享存储层,提供共享存储空间的存储区域.
性能评估:
从性能角度: Nginx<LVS 因为LVS集成在内核中,调用更方便.
从功能角度: Nginx>LVS
三种工作模型:NAT,TUN,DR. 其中DR模式性能最为优越,使用最为广泛。
NAT模式,通过网络地址转换实现,但进出数据包都要经过负载均衡器,容易形成集群瓶颈.
TUN模式,TUN模型是通过IP隧道技术实现的,TUN模型跟DR模型有点类似,不同的地方是负载均衡器(Director Server)跟应用服务器(Real Server)通信的机制是通过IP隧道技术将用户的请求转发到某个Real Server,而Real Server 也是直接响应用户的.
DR模式, diretor route直接路由模式,是通过路由技术实现的负载均衡技术,而这种模型与NAT模型不同的地方是,负载均衡器通过改写用户请求报文中的MAC地址,将请求发送到 Real Server, 而Real Server直接响应用户,这样就大大的减少负载均衡器的压力,DR模型也是用的最多的一种.
名词术语:
* director server 调度服务器,将负载分发到real server的服务器
* real server 真实服务器,真正提供应用服务的服务器
* VIP 虚拟IP地址,公布给用户访问的虚拟IP地址
* RIP 真实IP地址,集群节点上使用的IP地址
* DIP 调度器连接节点服务器的IP地址
常用算法:
-轮询(round robin -简写rr)
-加权轮询(weighted round robin)
-最少连接(least connections) 选择连接数最少的服务器
-加权最少连接(weighted least connections)
缺点:
上面说了负载均衡集群LVS,其实LVS有一个致命的缺点,当有台负载均衡器(Director Server) 挂掉的时候,那么整个集群将瘫痪了,上面说过负载均衡集群一般要和高可用集群结合起来使用的,这样就可以避免某个Director Server 出现故障而导致整个集群系统瘫痪.
LB 负载均衡集群
负载均衡集群主要是提高服务的响应能力的,比如说某服务器的并发响应能力是100个,这个时候经常有人反映说连不上服务器,这个时候解决方案一般有两种,
一,升级硬件,升级硬件显然不是很好的解决方案,假如说升级硬件之后过了一段时间由于业务量的加大,服务器又负载不起了怎么办呢.
二,将现有空闲低配的设备组合起来做成一个具有高并发的负载均衡集群,多台计算机同时分摊负载用户的请求,这样一来服务器的压力也没有那么大了,那么这一类的集群具有很好的可伸缩性,可靠性,和成本低廉等好处.
HA 高可用性集群
高可用性集群主要是提供7*24小时不间断服务的,不能说因为一台或几台服务器的down机而导致无法提供服务的,如果某台down机了,会自动的切换到其他计算机上面工作,从而达到高可用的效果.
HP 高性能集群
高性能集群主要是用于需要大量CPU运算的场景中,比如说天气预报,国外3D大片的特效制作,等等一系列需要做大量运算的应用.
二, LVS的三种工作模式解析
1.基于NAT的LVS模式负载均衡
NAT(Network Address Translation)即网络地址转换,其作用是通过数据报头的修改,使得位于企业内部的私有IP地址可以访问外网,以及外部用用户可以访问位于公司内部的私有IP主机。VS/NAT工作模式拓扑结构如图所示,LVS负载调度器可以使用两块网卡配置不同的IP地址,eth0设置为私钥IP与内部网络通过交换设备相互连接,eth1设备为外网IP与外部网络联通。
第一步,用户通过互联网DNS服务器解析到公司负载均衡设备上面的外网地址,相对于真实服务器而言,LVS外网IP又称VIP(Virtual IP Address),用户通过访问VIP,即可连接后端的真实服务器(Real Server),而这一切对用户而言都是透明的,用户以为自己访问的就是真实服务器,但他并不知道自己访问的VIP仅仅是一个调度器,也不清楚后端的真实服务器到底在哪里、有多少真实服务器。
第二步,用户将请求发送至124.125.136.12,此时LVS将根据预设的算法选择后端的一台真实服务器(192.168.0.1~192.168.0.3),将数据请求包转发给真实服务器,并且在转发之前LVS会修改数据包中的目标地址以及目标端口,目标地址与目标端口将被修改为选出的真实服务器IP地址以及相应的端口。
第三步,真实的服务器将响应数据包返回给LVS调度器,调度器在得到响应的数据包后会将源地址和源端口修改为VIP及调度器相应的端口,修改完成后,由调度器将响应数据包发送回终端用户,另外,由于LVS调度器有一个连接Hash表,该表中会记录连接请求及转发信息,当同一个连接的下一个数据包发送给调度器时,从该Hash表中可以直接找到之前的连接记录,并根据记录信息选出相同的真实服务器及端口信息.
2. 基于TUN的LVS负载均衡
在LVS(NAT)模式的集群环境中,由于所有的数据请求及响应的数据包都需要经过LVS调度器转发,如果后端服务器的数量大于10台,则调度器就会成为整个集群环境的瓶颈。我们知道,数据请求包往往远小于响应数据包的大小。因为响应数据包中包含有客户需要的具体数据,
所以LVS(TUN)的思路就是将请求与响应数据分离,让调度器仅处理数据请求,而让真实服务器响应数据包直接返回给客户端。VS/TUN工作模式拓扑结构如图所示。
其中,IP隧道(IP tunning)是一种数据包封装技术,它可以将原始数据包封装并添加新的包头(内容包括新的源地址及端口、目标地址及端口),从而实现将一个目标为调度器的VIP地址的数据包封装,通过隧道转发给后端的真实服务器(Real Server),通过将客户端发往调度器的原始数据包封装,并在其基础上添加新的数据包头(修改目标地址为调度器选择出来的真实服务器的IP地址及对应端口),通过公网直接给客户端主机响应数据。
3. 基于DR的LVS负载均衡
在LVS(TUN)模式下,由于需要在LVS调度器与真实服务器之间创建隧道连接,这同样会增加服务器的负担。与LVS(TUN)类似,DR模式也叫直接路由模式,其体系结构如图所示,该模式中LVS依然仅承担数据的入站请求以及根据算法选出合理的真实服务器,最终由后端真实服务器负责将响应数据包发送返回给客户端。
与隧道模式不同的是,直接路由模式(DR模式)要求调度器与后端服务器必须在同一个局域网内,VIP地址需要在调度器与后端所有的服务器间共享,因为最终的真实服务器给客户端回应数据包时需要设置源IP为VIP地址,目标IP为客户端IP,这样客户端访问的是调度器的VIP地址,回应的源地址也依然是该VIP地址(真实服务器上的VIP),客户端是感觉不到后端服务器存在的。
由于多台计算机都设置了同样一个VIP地址,所以在直接路由模式中要求调度器的VIP地址是对外可见的,客户端需要将请求数据包发送到调度器主机,而所有的真实服务器的VIP地址必须配置在Non-ARP的网络设备上,也就是该网络设备并不会向外广播自己的MAC及对应的IP地址,真实服务器的VIP对外界是不可见的,但真实服务器却可以接受目标地址VIP的网络请求,并在回应数据包时将源地址设置为该VIP地址。调度器根据算法在选出真实服务器后,在不修改数据报文的情况下,将数据帧的MAC地址修改为选出的真实服务器的MAC地址,通过交换机将该数据帧发给真实服务器。整个过程中,真实服务器的VIP不需要对外界可见。
三, LVS负载均衡调度算法
调度的策略与算法都是LVS的核心技术,内核中能实现的调度算法有:
1.轮询调度(Round Robin 简称'RR')
2.加权轮询(Weight Round Robin 简称'WRR')
3.最小连接调度(Least Connections 简称'LC')
4. 加权最少连接(Weight Least Connections 简称'WLC')
5.基于局部的最少连接调度(Locality-Based Least Connections 简称'LBLC')
6.带复制的基于局部性的最少连接(Locality-Based Least Connections with Replication 简称'LBLCR')
7.目标地址散列调度(Destination Hashing 简称'DH')
8.源地址散列调度(Source Hashing 简称'SH')
9. 最短的期望的延迟调度(Shortest Expected Delay 简称'SED')
10.最少队列调度(Never Queue 简称'NQ')
结束.