(5.17)mysql集群技术概述(LVS、Keepalived、HAproxy)

【1】集群技术的分类

【1.1】高可用集群(Hight Availability,HA)

  高可用的含义是最大限度地可以使用。主要是保障程序业务的不间断性和可扩展性。

【1.2】负载均衡集群(LoadBalance)

  主要分为前端负载调度和后端服务两个部分。

  负载调度部分负责把客户端的请求分配给后端服务节点,而后端节点是真正提供应用程序服务的部分。

  与高可用集群不同,负载均衡集群中所有的后端节点都处于活动状态,他们都对外提供同样的服务,分摊系统的工作负载。

【1.3】科学计算集群(High Performance Computing,HPC)

  高性能计算集群,这类集群致力于提供单个计算机所不能提供的强大计算力,包括数值计算和数据处理,并倾向追求综合性能。一般情况见不到这列。

 

【2】常用的负载均衡概述

【2.1】常用软件与设备

  开源软件:nginx、lvs、haproxy

  商业硬件负载设备:F5、Array、思科/华为等负载设备

【2.2】常用的 MySQL 从库负载均衡方案

  (1)F5之类的硬件负载设备 --优选

  (2)Keepalived + HAProxy(CPU、内存相对LVS占用的多一点) --次选

  (3)Lvs + Keepalived (LVS有长连接问题的缺陷,比如A机挂掉之后仍然会往A机分发)--次次选

【3】LVS

【3.1】LVS的概念

LVS:全称为Linux Virtual Server,LVS本质上是一个内核模块(ip_vs.so)。

因为LVS的负载调度是在Linux内核中实现,使用Linux内核集群实现一个高性能、高可用的负载均衡服务器。

【3.2】LVS的优点

《1》 抗负载能力强,是工作在网络4层之上仅做分发只用,没有流量产生,这个特点也决定了它在负载均衡软件里的性能最强,对内存和CPU的消耗也比较低。

《2》 配置性比较低,这是一个缺点也是一个优点,因为没有太多需要配置的东西,所以并不需要太多接触,大大减少了人为出错的几率,但缺点是功能比较少。

《3》工作稳定,因为其本身抗负载能力很强,自身有完整的双击热备方案,如LVS+Keepalived。项目中最常用的是LVS/DR+Keepalived(这里LVS/DR指的是 使用LVS的DR模式,DR指的是路由转发)

《4》无流量,LVS只分发强求,而流量并不从它本身出去,这点保证了均衡器IO的性能几乎不会受到大流量的影响

《5》应用范围比较广,因为LVS工作在4层,所以它几乎可以对所有应用做负载均衡,包括http、数据库、在线聊天室等等。

【3.3】LVS的缺点

《1》软件本身不支持正则表达式处理,不能做动静分离;而现在许多网站在这方面都有较强的需求,这个是Nginx/HAProxy+Keepalived的优势所在。

  相关概念:动静分离(简单概括就是静态数据和动态数据放开存放在不同机器上,分开访问)

  在做web开发的时候大家都清楚,js、html、图片资源、文件资源这些其实都属于静态资源,供用户直接访问,并不需要编译或者解释,是一些放在那里就可以用的东西,而jsp、java文件这些东西其实都需要被tomcat服务器解释一遍才能被机器识别,但是如果把它们都放在一起供用户访问,那每台服务器的压力岂不是很大,这个时候我们就可以做动静的分离,将这些静态的文件放置到Nginx服务器上,后面的tomcat服务器用来放动态的jsp、java文件,这样的话就变向的给服务器降低了压力。

《2》如果是网站应用比较庞大的话,LVS/DR+Keepalived实施起来就比较复杂了。特别是如果有Windows Server的机器的话,实施及配置还有维护过程就比较复杂了。(LVS相当于C/S架构)

相对而言,Nginx/HAProxy+Keepalived就简单许多。(当相遇B/S架构)

《3》LVS长连接缺陷

LVS走的TCP协议,当read库挂掉了,LVS也不会将其踢掉。

另外LVS对长连接的应用支持的不好,因为LVS的检查时长一般在30s,但长连接的设置一般都是30分钟,或者不设置timeout。

这样,当业务断开连接后,LVS还认为它是沉睡着的,所以连接到db的thread不会减少。

由此,很容易引起 thread_connect 占满,导致 MySQL 不可用。

所以,我们不能只用LVS,我们需要用LVS的内核,然后由keepalived来判断 Mysql的存活。

【3.4】LVS的三种部署模式

(1)NAT:地址转换(即多个地址转换成同一个出口地址)

(2)DR(Director Server):直接路由(通过路由的地址,都可以访问,无论是否在同一个网段)

(3)Tunnel:隧道模式,对 package 重新封装一层,realserver 需要重新解析

我们mysql常用的部署模式为DR模式,且DR模式的性能也是三者最好的。

【3.5】LVS的基本访问原理

  

 

 

 

 

轮询调度算法举例:如上图,客户端发起请求到LVS的VIP,然后LVS机器把请求路由转发给S1,然后S1处理好后响应回去给客户端。lo:0 就是我们常说的循环口(loopback口的别名)

下一次客户端继续发起请求到LVS的VIP,这次LVS机器把请求路由转发给S2机器,然后S2处理好响应回去给客户端。

就这样,轮流发送请求给S1、S2,比如:第一次请求给S1,第二次请求给S2,第三次请求又给S1,第四次请求给S2....以此达到负载均衡的效果。

注意:S1、S2机器,必须是同网段的IP

 

【4】LVS-DR模式的原理

【4.1】MAC地址替换(ARP欺骗)

  将发送给LVS请求包的目标MAC地址替换为某一个(由调度器根据算法调度分配)Server的MAC地址;

  然后将这个修改过目标的MAC地址请求包发送给对应的Server

【4.2】虚拟IP(即我们说的VIP)

  虚拟IP存在于LVS上,用于接受用户的请求,同事虚拟IP还版本在实际server的 lo:0 上(loopback口的别名)

访问过程案例:假如没有绑定虚拟IP在 lo:0 上

1)结合MAC替换,此时数据包调度给了某一个server;

2)server收到这个数据包后,首先检查目标 MAC 是否是自己的,由于之前做了MAC地址替换,所以检查的结果为真;

3)最后检查目标IP,由于虚拟IP没有绑定在 io:0 上,导致检查结果为假,则 server 会丢弃该数据包。

【4.3】io:0 接口的ARP抑制

问题:由于 server 上绑定虚拟IP 在 lo:0 上,那此时看来,同一个网络(VLAN)中存在多个同样的IP,那不就IP地址冲突了嘛?

回答:

  1)IP地址是否冲突主要是在一个网络内(比如VLAN)询问某一个IP地址,是否有多台主机应答(ARP广播);

  2)在 server 的 lo:0 上启用ARP抑制,这样一来当网络中有设备询问虚拟IP地址时,server将不做应答,此时只有LVS进行应答,确保不会引起冲突(即IP-MAC的映射关系在该网络中唯一)。

举例:

  我们做了LVS之后,映射了2台server,这2台server的 lo:0 端口都是绑定了VIP的,假设VIP地址是 192.168.135.210。

  当有请求访问 192.168.135.210 IP地址的时候,server1/server2/LVS机器都有192.168.135.210的IP地址;因为ARP抑制,网口 lo:0 不会响应(且该网口也没有对应的MAC),而LVS会响应请求然后根据调度算法转发到具体的某一台server上去。

  以此在避免冲突,达到IP-MAC映射关系在当前网络中唯一的效果。

 

【5】LVS10种调度算法

【5.1】Fixed Scheduling Method 静态调度算法(RR与SH使用的多)

(1)RR:轮询

  举个例子:假如LVS下有2台server,第一次请求给S1,第二次请求给S2,第三次请求又给S1,第四次请求给S2....等等轮流着来去访问。

(2)WRR:加权轮询

  LVS下面的server有权重值,同样假设LVS下有2台server,比如S1为55,S2为45;

  那么可能100个请求有55个给S1,45个给S2,也可以全部给权重高的S1,等S1有出问题才轮到S2;

(3)DH:目标地址hash

  就是同一个客户端的请求经过LVS 的HASH调度,选择到了目标 server,比如是server1,那么即使你server1机器出问题了,换了一个新机器一样的IP来顶替server1,hash算法的目标地址仍然是该机器。而不会是server2;

(4)SH:源地址hash

  解决session会话保持问题。客户端的会话一直在源地址上。

  服务端的响应通过LVS使用hash调度算法 指定了的对应的响应server,比如是server2,那么即使换了一台新机器一样的IP来顶替server2,hash算法的响应地址仍然是该机器。

总结

(1)(2)没什么好说的。

(3)(4)算法会永远固定一个LVS下的server ip 来做请求的目标地址 或者 响应的源地址,只要server的IP地址不变,换了机器也没关系。

 

【5.2】Dynamic Scheduling Method 动态调度算法(用的少)

(1)LC:最少连接

  意思就是,查看一下LVS下负载均衡server的客户端连接情况,哪台server客户端连接数最少,这次的客户端连接就分配给它。

(2)WLC:加权最少连接

(3)SED:最少期望延迟

(4)NQ:从不排队调度算法

(5)LBLC:基于本地的最少连接

(6)LBLCR:带复制的基于本地的最少连接

 

【6】KeepAlived的基本概念与原理

       双主KeepAlived

  利用KeepAlived实现故障转移(功能上类似于MSSQL的镜像,形式上类似于windows的故障转移群集)

【6.1】keepalived 简介

 参考:(5.1)mysql高可用系列——高可用架构方案概述 中的【4】双主keepalive

  (1.1.1)Keepalived服务的工作原理

  Keepalived服务对之间通过VRRP进行通信的,VRRP是通过竞选机制来确定主备的(有点像故障转移群集中的投票仲裁形式),主的优先级高于备,因此工作时主会优先获得所有的资源,备节点处于等待状态,当主挂了的时候,备节点就会接管主节点的资源,然后顶替主节点对外服务。

  在Keepalived服务对之间,只有作为主的服务器会一直发送VRRP广播包,告诉备它还活着,此时备不会抢占主,当主不可用(也就是备没有受到VRRP广播包信息),就会启动相关服务接管资源,保证业务的连续性,接管速度最快可以小于1秒。

  (1.1.2)keepalived 的三个核心模块

    分别是core/check/vrrp

    core:keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析。

    check:负责健康检查,包括常见的各种检查方式。

    vrrp:是用来实现VRRP协议的;(VRRP:全称 virtual router redundancy protocol,虚拟路由冗余协议)

  (1.1.3)什么是VRRP?

  VRRP,全称 virtual router redundancy protocol,虚拟路由冗余协议。

  VRRP的出现就是为了解决静态路由的单点故障问题,VRRP是通过一种竞选机制来将路由的任务交给某台VRRP路由器的。 

【6.2】keepalived的三种工作模式

  Keepalived通过组播(默认)、单播(自定义),实现keepalived主备推选,工作模式分为抢占和非抢占。

  《1》抢占模式

    主服务器正常工作时,虚拟IP会在主上,备不提供服务,当主服务优先级低于备的时候,备会自动抢占虚拟IP,这时,主不供服务,备提供服务。

    也就是说,抢占模式下,不分主备,只管优先级。

    不管 keepalived.conf 里的 state 配置成 master 还是 backup ,只看谁的priority 优先级高, priority 优先级高的那一个,在故障恢复后,会自动将VIP资源再次抢回来。

    举例:

1)俩台都为master/backup时,比如server1的优先级大于server2,keepalived启动后server1获得master,server2自动降级为backup。

   此时server1宕机的话,server2接替 服务,当server1恢复后,server1又变为master,重新接管服务,server2变为backup。属于抢占式。

2)  server1为master,server2位backup,且master优先级大于backup。keepalived启动后server1获得master,server2为backup。

     当server1宕机后, server2接管服务。当server1恢复后,server1重新接管服务变为master,而server2变为backup。属于抢占式

3)  server1为master,server2位backup,且master优先级低于backup。keepalived启动后server2获得master,server1为backup。

     当server2宕机后, server1接管服务。此时server2恢复后抢占服务,获得master,server1降级将为backup。属于抢占式

  《2》非抢占模式

    这种方式通过参数nopreempt(一般设置在advert_int 的那一行下面)来控制。不管priority优先级,只要master机器发生故障,VIP资源就会被切换到backup上。

    并且,当master机器恢复后,也不会将VIP资源抢回来。除非Backup机器发生故障,才能自动把VIP等资源切换会主库。

    

    nopreempt 这个参数只能用户state为backup的情况,所以在配置的时候要把master和backup的state都设置成backup,这样才会实现keepalived的非抢占模式!

    也就是说

    d)  当state状态都为master或者都为backup的时候,没有加nopreempt参数,那么

    a)当state状态一个为master,一个为backup的时候,加不加nopreempt 这个参数都是一样的效果。

      即都是根据priority优先级来决定谁抢占VIP资源,属于抢占模式!

    b)当state状态都设置成backup,如果不配置nopreempt参数。

      也是根据priority优先级来决定谁抢占VIP资源,属于抢占模式!

    c)当state状态都设置成backup,如果配置了 nopreempt 参数,那么久不会去考虑priority优先级了。

      是非抢占模式! 即只有VIP当前所在机器发生故障,另一台机器才能接管VIP。 不考虑优先级问题。

      注意:这样配置后,我们要注意启动服务的顺序,优先启动的获取master权限,与优先级没有关系了

【6.3】keepalived软件包组成

Keepalived是一个高度模块化设计的软件,从源代码结构似乎也很容易看出这一点。Keepalived 1.2.13源代码中只有如下目录:check  core  etc  include  libipvs-2.4  libipvs-2.6  vrrp

check:Keepalived的healthchecker子进程的目录,包括了所有的健康检查方式以及对应配置的解析,LVS的配置解析也在这个里面。
core:Keepalived的核心程序,如全局配置的解析,进程启动等等。
etc:包含Keepalived的配置模板和启动脚本等文件。
include:头文件目录。
libipvs*:LVS使用的库文件。
vrrp:Keepalived的vrrpd子进程以及相关的代码。

(1) 多进程模式
        Keepalived采用了多进程的设计模式,每个进程负责不同的功能,我们在使用LVS的机器上通常可以看到三个Keepalived进程:
111 keepalived    < 父进程,负责内存管理、监控子进程等
112 \_ keepalived < VRRP子进程
113 \_ keepalived < healthchecker子进程
 

(2) 控制面板
        这里所谓的控制面板就是对配置文件的编译和解析。Keepalived的配置文件解析比较另类,并不是一次解析所有配置,而是只在用到某模块时才解析相应的配置。在源文件里面可以看到类似XXX_parser.c的文件,就是做这个用的。
 

(3) 看门狗
        WatchDog框架提供了对VRRP和healthchecker子进程的监控。
 

(4)IPVS封装
        Keepalived里面所有对LVS的相关操作并不直接使用ipvsadm客户端程序,而是使用IPVS提供的函数进行操作,这些代码都在check/ipwrapper.c中。

 

【6.4】Keepalived在MySQL上有的作用

  mysql双主复制,即互为Master-Slave(只有一个Master提供写操作),可以实现数据库服务器的热备。

  但一个Master宕机后不能实现动态切换,使用Keepalived,可以通过虚拟IP,实现双主对外的统一接口以及自动检查、失败切换机制,从而实现MySQL数据库的高可用方案。

 

【6.5】Keepalived 在 LVS 上的作用

(1)管理LVS负载均衡软件

(2)实现LVS集群节点的健康检查

(3)作为系统网络服务的高可用性(failover)

 

(6.6)Keepalived的主从切换时间

参考自:keepalived主备切换时间研究

结论:

(1)检查脚本挂掉,关闭keepalived ,1秒内(服务关闭+VRRP广播时间)

(2)服务器宕机,advert_int 为 1 的话,默认超时3次就启动故障转移,所以则是 3*1(advert_int)+1(VRRP) 

【7】HAproxy

【7.1】HAproxy软件介绍

HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用层的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。

基于TCP (四层),HTTP (七层) 应用的负载均衡软件,HAProxy特别适用于那些负载特别大的web站点,这些站点通常有需要会话保持或七层处理。

HAProxy运行在当前的硬件上,完全可以支持数以万计的并发连接,并且它的运行模式使得它可以很简单安全的整合进您现有的架构中,同事可以保护你的web服务器不被暴露到网络上。国内生产环境上使用HAProxy的公司很多,比如淘宝的CDN系统。

【7.2】HAProxy软件优点

(1)可靠性和稳定性非常好,可以与硬件级F5负载均衡设备媲美

(2)最高可同事维护4W-5W个并发连接,单位时间内最大请求为20000个,最大数据处理能力可达10Gbps。

(3)支持多于8中负载均衡算法,同事支持会话保持。

(4)支持虚拟主机功能

(5)从1.3版本后支持拒绝连接,全透明代理,这些功能室其他负载均衡所不具备的

(6)HAProxy拥有一个强大的服务器状态监控页面,可以通过此页面实时了解系统状况

(7)HAproxy拥有功能强大的ACL支持,给使用上带来很大方面

(8)HAProxy是借助于操作系统的技术特性来实现性能最大化的,因此,在使用HAProxy时对操作系统的性能调优是非常重要的。

(9)能够补充Nginx的一些缺点,比如Session的保持,Cookie的引导等工作,支持url检测后端的服务器出问题的检查会有很好的帮助,它和LVS一样,本身仅仅就只是一款负载均衡软件。

【7.3】HAProxy的常见8种算法(RR与source常用)

(1)RR(roundrobin):轮询

(2)static-rr:表示根据权重,建议关注;

(3)leastconn:表示根据最少连接,建议关注;

(4)source:表示根据请求源IP,这个和Nginx的IP_hash机制类似,我们用其作为解决 session 问题的一种方法,建议关注;

(5)ri:表示根据请求的URL

(6)rl_param:表示根据请求的URL参数

(7)hdr(name):表示根据HTTP请求头来锁定每一次HTTP请求;

(8)rdp-cookie(name):表示根据cookie(name)来锁定并 hash 每一次TCP请求。

 

【8】比较流行的架构方案

【8.1】WEB端使用的负载均衡

  采用Nginx/HAProxy + Keepalived作负载均衡器;

【8.2】后端数据库mysql集群

  后端采用 mysql 数据库一主多从和读写分离,也可以MHA+Keepalived

  (1)LVS+Keepalived 

  (2)HAProxy+Keepalived

  (3)硬件F5之类的架构

【8.3】总结

mysql节点是集群的基础,组成 Server Array,其中每个节点作为 Real Server。

LVS服务器提供了负载均衡的作用,将用户请求分发到 Real Server,一台 Real Server故障并不会影响整个集群。

Keepalived搭建主备LVS服务器,避免LVS服务器单点故障,出现故障时可以自动切换到正常的节点。

 

posted @ 2020-03-18 21:43  郭大侠1  阅读(676)  评论(0编辑  收藏  举报