Fork me on GitHub

【Distributed】大型网站高并发和高可用

一、DNS域名解析

  • 整个过程大体描述如下,其中前两个步骤是在本机完成的,后8个步骤涉及到真正的域名解析服务器:
      
  • 浏览器会检查缓存中有没有这个域名对应的解析过的IP地址,如果缓存中有,这个解析过程就结束。浏览器缓存域名也是有限制的,不仅浏览器缓存大小有限制,而且缓存的时间也有限制,通常情况下为几分钟到几小时不等,域名被缓存的时间限制可以通过TTL属性来设置。这个缓存时间太长和太短都不太好,如果时间太长,一旦域名被解析到的IP有变化,会导致被客户端缓存的域名无法解析到变化后的IP地址,以致该域名不能正常解析,这段时间内有一部分用户无法访问网站。如果设置时间太短,会导致用户每次访问网站都要重新解析一次域名。
  • 如果用户浏览器缓存中没有数据,浏览器会查找操作系统缓存中是否有这个域名对应的DNS解析结果。其实操作系统也有一个域名解析的过程,在Windows中可以通过C:\Windows\System32\drivers\etc\hosts文件来设置,在Linux中可以通过/etc/hosts文件来设置,用户可以将任何域名解析到任何能够访问的IP地址。例如,我们在测试时可以将一个域名解析到一台测试服务器上,这样不用修改任何代码就能测试到单独服务器上的代码的业务逻辑是否正确。正是因为有这种本地DNS解析的规程,所以有黑客就可能通过修改用户的域名来把特定的域名解析到他指定的IP地址上,导致这些域名被劫持。
  • 前两个过程无法解析时,就要用到我们网络配置中的"DNS服务器地址"了。操作系统会把这个域名发送给这个LDNS,也就是本地区的域名服务器。这个DNS通常都提供给用户本地互联网接入的一个DNS解析服务,例如用户是在学校接入互联网,那么用户的DNS服务器肯定在学校;如果用户是在小区接入互联网,那么用户的DNS就是再提供接入互联网的应用提供商,即电信或联通,也就是通常说的SPA,那么这个DNS通常也会在用户所在城市的某个角落,不会很远。Windows环境下通过命令行输入ipconfig,Linux环境下通过cat /etc/resolv.conf就可以查询配置的DNS服务器了。这个专门的域名解析服务器性能都会很好,它们一般都会缓存域名解析结果,当然缓存时间是受到域名的失效时间控制的。大约80%的域名解析到这里就结束了,所以LDNS主要承担了域名的解析工作。
  • 如果LDNS仍然没有命中,就直接到Root Server域名服务器请求解析
  • 根域名服务器返回给本地域名服务器一个所查询的主域名服务器(gTLD Server)地址。gTLD是国际顶级域名服务器,如.com、.cn、.org等,全球只有13台左右
  • 本地域名服务器LDNS再向上一步返回的gTLD服务器发送请求
  • 接受请求的gTLD服务器查找并返回此域名对应的Name Server域名服务器的地址,这个Name Server通常就是用户注册的域名服务器,例如用户在某个域名服务提供商申请的域名,那么这个域名解析任务就由这个域名提供商的服务器来完成
  • Name Server域名服务器会查询存储的域名和IP的映射关系表,在正常情况下都根据域名得到目标IP地址,连同一个TTL值返回给DNS Server域名服务器
  • 返回该域名对应的IP和TTL值,LDNS会缓存这个域名和IP的对应关系,缓存时间由TTL值控制
  • 把解析的结果返回给用户,用户根据TTL值缓存在本地系统缓存中,域名解析过程结束在实际的DNS解析过程中,可能还不止这10步,如Name Server可能有很多级,或者有一个GTM来负载均衡控制,这都有可能会影响域名解析过程。

二、大型网站系统应有的特点

  1. 高并发,大流量:需要面对高并发用户,大流量访问。举个例子,去往迪拜的飞机有200张票,但是有100w人都挤进系统买票,如何让这100w人能够看到票务的实时更新,以及顺利的买到一张票,都是一个网站架构师应该考虑的问题。这也许对于淘宝的“双十一”1000w的一分钟独立访问用户量来说,是个微不足道的数字,但是对于用户的体验以及网站的口碑来说,都是一项不小的挑战。
  2. 高可用:相对于高并发来说,高可用并不是一个比较有规律的参数,7*24 是每个网站的梦想,但是你并不知道,在某一刻,他就没理由的宕机了。
  3. 海量数据:存储,管理海量的数据,需要使用大量的服务器。FaceBook每周上传的照片接近10亿,没有一个大型的存储服务器的支撑,相信用户量不会一直飙升。
  4. 用户分布广泛,网络情况复杂:许多大型的互联网都是为全球用户提供服务的,用户分布范围广,各地网络情况千差万别。各个运行商之间的互通,各个国家的数据连接等等。
  5. 安全环境恶劣:由于互联网的开放性,使得互联网更容易受到攻击,包括各种省份证信息被窃取等事件屡见不鲜。
  6. 渐进式发展:几乎所有的大型互联网网站都是从一个小网站开始,渐进发展起来的,好的互联网产品都是慢慢运营出来的。

三、网站架构演变过程

3.1 传统架构

  • 传统项目分为三层架构,将业务逻辑层、数据库访问层、控制层放入在一个项目中 使用SSH或者SSM技术。
  • 优点:适合于个人或者小团队开发,不适合大团队开发。

3.2 分布式架构

  • 根据业务需求进行拆分成N个子系统,多个子系统相互协作才能完成业务流程子系统之间通讯使用RPC远程通讯技术。

优点:

  1. 把模块拆分,使用接口通信,降低模块之间的耦合度。
  2. 把项目拆分成若干个子项目,不同的团队负责不同的子项目。
  3. 增加功能时只需要再增加一个子项目,调用其它系统的接口就可以。
  4. 可以灵活的进行分布式部署。

有优点就有缺点,缺点如下:

  1. 系统之间交互需要使用远程通信,接口开发增加工作量。
  2. 各个模块有一些通用的业务逻辑无法共用。

  • 为了解决上面分布式架构的缺点,我们引入了soa架构,SOA:Service Oriented Architecture面向服务的架构。也就是把工程拆分成服务层、表现层两个工程。服务层中包含业务逻辑,只需要对外提供服务即可。表现层只需要处理和页面的交互,业务逻辑都是调用服务层的服务来实现。

3.3 SOA架构

  • SOA是一种软件架构模式,将共同的业务逻辑抽取出来,封装成单独的服务,业务系统分解为多个组件,让每个组件都独立提供离散,自治,可复用的服务能力,通过服务的组合和编排来实现上层的业务流程
  • 作用:简化维护,降低整体风险,伸缩灵活

3.4 微服务架构

  • 微服务是指开发一个单个、小型的但有业务的服务,每个服务都有自己的处理和轻通讯机制,可以部署在单个服务器上,让专业的人做专业的事情。微服务与SOA相比,更加轻量级。

SOA与微服务架构区别:

  • SOA架构主要针对企业级、采用ESB服务(ESB企业服务总线),非常重,需要序列化和反序列化,采用XML格式传输。
  • 微服务架构主要互联网公司,轻量级、小巧,独立运行,基于Http+Rest+JSON格式传输。ESB也可以说是传统中间件技术与XML、Web服务等技术相互结合的产物。
  • 在微服务中,与SOA不同,服务可以独立于其他服务进行操作和部署,因此更容易经常部署新版本的服务和独立扩张服务,让专业的人做专业的事情,快速迭代新的产品。
  • 在SOA中服务可能共享数据存储,而微服务中每个服务都具有独立的数据存储。
  • SOA与微服务主要区别在于规模和范围,SOA是一种思想,是面向服务架构体系,微服务继承 了SOA的优点,去除传统的ESB消息总线,采用Http+json格式通讯方式,更加轻量级。

四、高并发设计原则

  • 系统设计不仅需要考虑实现业务功能,还要保证系统高并发、高可用、高可靠等。同时还应考虑系统容量规划(流量、容量等)、SLA指定(吞吐量、响应时间、可用性、降级方案等)、监控报警(机器负载、响应时间、可用率等)、应急预案(容灾、降级、限流、隔离、切流量、可回滚等)。
  • 缓存
  • 异步并发
  • 连接池
  • 线程池
  • 扩容
  • 消息队列
  • 分布式任务

4.1 拆分系统

  • 在我们从零开始做一个新系统的时候,会首先进行系统功能模块架构设计,那么是直接做一个大而全的垂直的MVC系统,使用一个war包进行发布管理,还是需要按一些规则进行模块拆分,设计成SOA或者微服务系统比较好呢?
  • 这需要依据项目具有什么样的人力物力条件以及项目需要支撑多少用户量和交易量为基础。
  • 一个好的系统设计应该能够满足解决当前的需求和问题,把控实现和进度风险,预测和规划未来,避免过度设计,在上线一个基础核心版本之后,再进行不断迭代和完善。

  • 在进行SOA、微服务系统架构设计时模块拆分的一些维度和原则。

  • 系统维度:按照系统功能、业务拆分,如、优惠券、购物车,结算,订单等系统。

  • 功能维度:对系统功能在做细粒度拆分,优惠券系统分为 优惠券后台系统、领券系统、发券系统。

  • 读写维度:比如商品系统中,如果查询量比较大,可以单独分为两个服务,分别为查询服务和写服务,

  • 读写比例特征拆分;读多,可考虑多级缓存;写多,可考虑分库分表.

  • AOP 维度:根据访问特征,按照 AOP 进行拆分,比如商品详情页可分为 CDN、页面渲染系统,CDN 就是一个 AOP 系统

  • 模块维度:对整体代码结构划分 Web、Service、DAO

4.2 服务化

  • 在分布式系统中,将业务逻辑层封装成接口形式,暴露给其他系统调用,那么这个接口我们可以理解为叫做服务。
  • 当服务越来越多的时候,就会需要用到服务治理,那么会用到Dubbo、SpringCloud服务治理框架
  • 服务化演进: 进程内服务-单机远程服务-集群手动注册服务-自动注册和发现服务-服务的分组、隔离、路由-服务治理
  • 考虑服务分组、隔离、限流、黑白名单、超时、重试机制、路由、故障补偿等
  • 利用 Nginx、HaProxy、LVS 等实现负载均衡,ZooKeeper、Consul 等实现自动注册和发现服务

4.3 消息队列

  • 消息中间件是一个客户端与服务器异步通讯框架,消息中间件中分为点对点与发布订阅通讯方式,生产者发送消息后,消费者可以无需等待, 异步接受生产者发送消息。
  • 在电商系统中,会使用消息队列异步推送消息,注意消息失败重试幂等性问题。
  • 幂等性问题解决方案,使用持久化日志+全局id记录。

4.4 缓存技术

  • 浏览器端缓存
  • APP客户端缓存
  • CDN(Content Delivery Network)缓存
  • 接入层缓存
  • 应用层缓存
  • 分布式缓存
  • 对于兜底数据或者异常数据,不应该让其缓存,否则用户会在很长一段时间里看到这些数据。

4.5 并发化

  • 改串行为并行。

五、高可用设计原则

  • 通过负载均衡和反向代理实现分流。
  • 通过限流保护服务免受雪崩之灾。
  • 通过降级实现部分可用、有损服务。
  • 通过隔离实现故障隔离。
  • 通过合理设置的超时与重试机制避免请求堆积造成雪崩。
  • 通过回滚机制快速修复错误版本。

5.1 降级

  • 对于高可用服务,很重要的一个设计就是降级开关,在设计降级开关时,主要依据如下思路:
  • 开关集中化管理:通过推送机制把开关推送到各个应用。
  • 可降级的多级读服务:比如服务调用降级为只读本地缓存、只读分布式缓存、只读默认降级数据(如库存状态默认有货)。
  • 开关前置化:如架构是Nginx–>tomcat,可以将开关前置到Nginx接入层,在Nginx层做开关,请求流量回源后端应用或者只是一小部分流量回源。
  • 业务降级:当高并发流量来袭,在电商系统大促设计时保障用户能下单、能支付是核心要求,并保障数据最终一致性即可。这样就可以把一些同步调用改成异步调用,优先理高优先级数据或特殊特征的数据,合理分配进入系统的流量,以保障系统可用。

5.2 限流

  • 目的: 防止恶意请求攻击或超出系统峰值

5.4 切流量

  • 目的:屏蔽故障机器

5.5 可回滚

  • 发布版本失败时可随时快速回退到上一个稳定版本

六、业务设计原则

6.1 防重设计

  • 页面请求防止重复提交,可以采用防重key、放重表、Token等
  • 采用图形验证,防止机器攻击。

6.2 幂等设计

  • 消息中间件:消息中间件中应该注意因网络延迟的原因,导致消息重复消费
  • 第三方支付接口:在回调接口中,应该注意网络延迟,没有及时返回给第三方支付平台,注意回调幂等性问题。
  • 分布式系统中,保证生成的订单号唯一性,定时Job执行的幂等性问题等。

6.3 流程定义

  • 复用流程系统,提供个性化的流程服务。

6.4 状态与状态机

  • 复用流程系统,提供个性化的流程服务。

6.5 后台系统操作可反馈

  • 设计后台系统时,考虑效果的可预览、可反馈。

6.6 后台系统审批化

  • 对于有些重要的后台功能需要设计审批流,比如调整价格,并对操作进行日志记录,从而保证操作可追溯、可审计。

6.7 文档注释

  • 系统发展的最初阶段就应该有文档库(设计架构、设计思想、数据字典/业务流程、现有问题),业务代码合特殊需求都要有注释。

6.8 备份

  • 包括代码和人员的备份。代码主要提交到代码仓库进行管理和备份,代码仓库至少应该具备多版本的功能。人员备份指的是一个系统至少应该有两名开发人员是了解的。
posted @ 2019-10-23 17:32  这个世界~  阅读(466)  评论(0编辑  收藏  举报