cluster集群基本概念

cluster集群种类：

1，LB（Load Balance）负载均衡集群：

弱点：当横向扩展到一定机器后，发现在怎么横向加机器也没有效果的时候，瓶颈就卡在分发的服务器上了，也就是LB机器上了，如何解决呢？功能拆分吗，一个功能一个LB集群。

2，HA（High Availability）高可用集群：有多个LB，一旦主LB挂断，副LB马上取而代之。副LB怎么知道主LB是否还或者呢，主LB每间隔一段时间（1秒或者半秒）向副LB集群发送还活着的信息，副LB接到了主LB还或者的信息，就知道了它还或者。如果多次副LB没有接收到主LB的活着的信息，则取而代之。那么副LB怎么取代主LB呢，把主LB的IP设置成自己机器的IP，并启动和主LB同样的服务。

3，HP（High performance）集群

向量机：通过在一台机器上增加硬（比如加100个CPU）件的方式提高性能。
并行处理集群：横向扩展
- 需要一个分布式文件系统
- 将大任务切割为小任务，分别进行处理的机制

上面3种集群的各自用途：

LB用于高并发
HA用于高稳定
HP用于海量数据分析（大数据分析，比如分析中国15亿人），复杂的科学计算，模拟核弹爆炸，天气预报

集群节点间的文件同步：

rsync：远程文件拷贝命令

inotify ：内核监控文件发生变化后，会发信号给用户进程。

所以使用rsync+inotify ，可以实现，各个服务器机器见的静态文件的同步。

health check：

试想一下，如果LB下的某个机器坏掉了，会发生什么情况？LB分发到这台机器上的请求，这台机器不能处理了。所以LB需要知道地下的机器哪些挂掉了，哪些又从挂掉的状态恢复成正常状态了，这就是health check。如果发现它挂掉了，则不往它这里分发请求了。如果它又恢复了，则继续往它这里分发请求。

DAS和NAS

DAS:direct attached storage

以块为单位请求文件

NAS:network attached storage

以整个文件为单位请求文件

DAS的传输速度根据设备类型的不同，最少也能320Mbps，最高的能6Gbps；

而百兆以太网的速度为12.5Mbps，千兆125Mbps。

所以DAS的性能更好。如果多台主机同时使用DAS设备，是通过线连接到DAS设备上的，DAS设备相当于一块硬盘，里面没有操作系统，所以主机1写DAS上的文件A，主机B也写DAS上的文件A，文件A就会错乱。主机1的进程1写DAS上的文件A，主机1的进程2写DAS上的文件A，主机1的操作系统会提供锁机制。

主副切换时，会产生split-brain：脑裂

主服务器由于太忙了，没来得及给副服务器发送心跳信息，这时副服务器取代了主服务器，

但是在主服务器还有一些数据没有写到DAS设备上，数据就丢失了。

如何解决呢，防止主服务器是假死，所以补上一刀，直接拔掉主服务器的电源。

只要主服务器和副服务器都插在一个电源管理器上的话，副服务器发送关闭主服务器的命令给电源管理器械就行了。

stonith：shoot the other node in the head爆头。

隔离机制：fencing

1，节点级别：stonith

2，资源级别：切断某个主机能够访问DAS的接口

如果只有主服务器和一个副服务器，它们2个就会来回强着当主服务器，为了避免split-brain，我们就需要至少3台服务器或者奇数个服务器作为一个集群。

其中一台接受不到另外2台的心跳了，自动把自己下线
其中2台都接受不到另外一条的心跳了，杀死它。

LB集群

Hardware
- F5（最好？），BIG IP
- Citrix,Netscaler
- A10（最便宜）
Software
- 四层
  - LVS（Linux Virtual Server）国人发明的
- 七层
  - nginx
    
    http ，smtp，pop3，imap
  - haproxy
    
    http，tcp（mysql，smtp）
- 四层和七层的区别：4层是在IP和端口上做负载均衡，7层是在特定的应用层协议上做负载均衡。

四层的LVS说明

LVS不能和iptables一起使用，LVS是工作在内核区域的。

iptables/netfilter

LVS

ipvsadm：用户区。管理集群服务的命令行工具
ipvs:在内核区

IP地址的名词解释：

CIP：客户端的IP
VIP：负载均衡机器（director）的公网IP，也就是客户端发送请求里的目标IP。
DIP：转发请求时，使用的IP
RIP：集群节点机器的IP

LVS种类：

1，NAT

集群主机必须和负载均衡主机在同一个内网了，而且DIP必须是RIP们的网关
RIP是私有IP
DIP位于CIP和RIP之间，即负责CIP过来接收请求，然后把目标IP从VIP修改为RIP，然后RIP机器处理完成后，把相应再发回DIP机器（director），然后DIP再把目标IP从RIP修改回VIP。所以director的负载很重
支持端口映射，RIP的服务的端口可以是任意的
real server可以是任意操作系统，但是director必须是Linux系统
确定director是最容易形成性能瓶颈的。最多挂10 real server

，DR：直接路由。被使用最多

集群节点必须和director在同一个物理网络中（同一个物理网络是什么意思？？？）
director只负责接收请求，而不负责响应；相应报文直接发给CIP
实际过来的是，请求端IP为CIP，目标端IP为VIP。
每台RIP机器配2个IP，一个是VIP但必须是隐藏的，负责IP就会冲突了；另一个是RIP
当CIP的请求发送到了VIP，然后director不修改目标IP，所以目标IP还是VIP，它修改MAC地址，把目标IP携带的MAC地址修改为RIP的，real server处理完后，把相应报文用隐藏的VIP发送给CIP，这样一来就不用经过director了。

VIP是配置到网卡别名上，并且是隐藏的，不用于接受请求，只用于发送相应。
RIP可以使用公网IP，实现便捷的远程管理。也可以是私有IP
集群节点一定不能将网关指向DIP
director不支持端口映射
RIP机器上可以使用大多数操作系统，前提是支持IP隐藏功能。
DR模式可以带动更多的real server，至少100以上。

理由：只负责接收请求，而不负责响应；请求报文很小，响应报文很大，director不处理响应报文了，所以性能提高很大。

3，TUN模式

解决real server 分布在不同的国家，不同的城市

director通过隧道协议把原CIP和目标VIP作为报文发给realserver，发的时候，使用DIR-》RIP
RIP要有公网IP，realserver的OS必须支持隧道协议
其余的和DR模式一样

调度算法：静态调度，动态调度

（active）活动连接数：正在传输数据

（inactive）非活动连接数：传输数据完成了，但是连接还没有断开。

静态调度（固定调度）：调度器不管realserver的活动连接数和非活动连接数，按照事先指定好的算法调度。所以就有可能把某个realserver累死了，有的闲死了。

rr：轮询（平均呼叫）
wrr：weight 加权轮询（性能好的realserver多叫，不好的少叫）
sh（source hash 原地址hash）：只要是同一个CIP来的请求，都给固定的realserver。

感觉很奇怪，这不就破坏了负载均衡的机制了吗，为什么会有这样的算法？

http协议是无状态的短链接，所以server处理完会给浏览器发送一个身份信息，来标识这个client，

浏览器会把这个信息保存在本地的cookie中。早期cookie里有太多的敏感信息，会泄露用户的信息，

所以浏览器保存了最少量的信息，变成了轻cookie，原来的信息放到了server端，存到了server的内存中，叫session。就是为了找到原来的session，才需要把同一个CIP导向到原来的real server。

如果各个节点的real server可以同步session的话，sh调度算法就没有使用的必要了。
dh（destination hash 目标地址hash）：和sh算法类似。用于缓存服务器集群。保证缓存命中率的提高。

动态调度：调度器要考虑realserver的活动连接数和非活动连接数

lc（最少连接）：计算:active × 256 + inactive，结果最小的realserver，作为这次的目标realserver
wlc：加权lc。计算：（active × 256 + inactive）/weight，结果最小的realserver，作为这次的目标realserver。wlc被使用最多
sed（最短期望延迟）计算：（active+1） × 256/weight，结果最小的realserver，作为这次的目标realserver
np（never queue 永不排队）：只要有个realsever没有被分到，就分给它一个再说。
lblc（基于本地的最少连接）：相当于动态的dh，不考虑active数
lblcr（基于本地的带复制功能的最少连接）：考虑active数

c/c++ 学习互助QQ群：877684253

本人微信：xiaoshitou5854

posted @ 2019-09-26 15:47 小石王阅读(2091) 评论(0) 收藏举报

刷新页面返回顶部

小石王