负载均衡知识

 

  一提到负载均衡,相信很多同学都直接会想到nginx反向代理,因为我们平时比较熟悉的就是用nginx做web服务的负载均衡。其实nginx只是负载均衡里的一部分,在web应用中的每个层级其实都涉及到负载均衡。

  那么何为负载均衡?这个概念其实也同样很重要,很多同学又说了,负载均衡还不简单,就是在分布式系统中,将客户端的请求均匀的分配到服务端(或者说将上游的请求,均衡的分配到下游的多个操作单元中),其实这只回答了一半。请求的均衡是一方面,另一方面,数据也是要均衡的分布在操作单元中的。

  因此,负载均衡就是将请求/数据【均匀】分摊到多个操作单元上执行。

 

  常见负载均衡方案

  梳理下web应用的基本架构:

  

  正常的web分布式项目的基本架构层级就是这样(多台机器的集群我省略没画),分为客户端层、反向代理nginx层、站点层、服务层、数据层

  【客户端层->反向代理层】的负载均衡

  【客户端层】到【反向代理层】的负载均衡,是通过“DNS轮询”实现的:DNS-server对于一个域名配置了多个解析ip,每次DNS解析请求来访问DNS-server,会轮询返回这些ip,保证每个ip的解析概率是相同的。这些ip就是nginx的外网ip,以做到每台nginx的请求分配也是均衡的。

 

  【反向代理层->站点层】的负载均衡

  【反向代理层】到【站点层】的负载均衡,是通过“nginx”实现的。通过修改nginx.conf,可以实现多种负载均衡策略:比如轮询,最少连接路由,ip 哈希等等。

 

  【站点层->服务层】的负载均衡

  【站点层】到【服务层】的负载均衡,是通过“服务连接池”实现的。

 

  【数据层】的负载均衡

  在数据量很大的情况下,由于数据层(db,cache)涉及数据的水平切分,所以数据层的负载均衡更为复杂一些,它分为“数据的均衡”,与“请求的均衡”。

  数据的均衡是指:水平切分后的每个服务(db,cache),数据量是差不多的。

  请求的均衡是指:水平切分后的每个服务(db,cache),请求量是差不多的。

  常见的水平切分方式有这么几种:

  一、按照range水平切分:

  每一个数据服务,存储一定范围的数据,比如 db1服务,存储uid范围1-1kw; db2服务,存储uid范围1kw-2kw。

  这个方案的好处是:

  (1)规则简单,service只需判断一下uid范围就能路由到对应的存储服务

  (2)数据均衡性较好

  (3)比较容易扩展,可以随时加一个uid[2kw,3kw]的数据服务

  不足是:

  (1)请求的负载不一定均衡,一般来说,新注册的用户会比老用户更活跃,大range的服务请求压力会更大。

  

  二、按照id哈希水平切分

  每一个数据服务,存储某个key值hash后的部分数据,比如 db1服务,存储偶数uid数据; db2服务,存储奇数uid数据。

  这个方案的好处是:

  (1)规则简单,service只需对uid进行hash能路由到对应的存储服务

  (2)数据均衡性较好

  (3)请求均匀性较好

  不足是:

  (1)不容易扩展,扩展一个数据服务,hash方法改变时候,可能需要进行数据迁移。

 

  大伙儿有没有发现,在分布式系统的架构设计上, 扩展性也是要经常考虑的因素哦!

posted @ 2018-05-19 23:46  海小鑫  阅读(339)  评论(0编辑  收藏  举报