架构系统的雪崩理解

1.背景

最近遇到了线上服务的雪崩，查查资料，整理整理。

离线架构更多的是考虑数据写入时的，

在线架构更多的是考虑数据读取时的，

2.什么是雪崩

指分布式系统中经常会出现某个基础服务不可用造成整个系统不可用的情况, 这种现象被称为服务雪崩效应。

离线雪崩时，新数据无法更新，导致队列堵塞。

在线雪崩时，在线无法提供正常的检索服务，从外部看整个系统不可用。

因此，通常雪崩都是说的在线架构。

3. 如何形成的在线雪崩

离线雪崩时，新数据无法更新，导致队列堵塞。

在线雪崩时，在线无法提供正常的检索服务，从外部看整个系统不可用。

因此，通常雪崩都是说的在线架构。

在线请求需要在规定时间内返回结果，通常上游对下游的超时时间会设置稍大一些考虑到下游模块可能需要重试。

下面的图，大致演示了在线架构雪崩，如果底层模块出问题，大量请求为返回，可能导致多个模块对下游的重试，导致最终下游模块由于请求量过大系统不可用。

导致雪崩的情况可能有：

4. 如何避免

大部分都是套路，除了因为代码bug。

大致套路，

参考:

(1) https://segmentfault.com/a/1190000005988895

(2) https://blog.csdn.net/starryninglong/article/details/65628337

posted on 2018-05-19 09:20 旭东的博客阅读(2593) 评论(0) 编辑收藏举报

刷新页面返回顶部

旭东的博客