大促准备(六)预案配置和演练
一.为什么要有预案
事有轻重缓急,对于一个系统也是如此,在大促期间通常会将系统中一些不太重要的业务或操作给降级,比如详情日志打印、营销类的消息、业务控制等,将资源用于大促中不得不操作的业务上;或者在大促过程中进行链路的切换,比如启用近端、启用异步执行或者合并执行等。
一个系统通常有多个这样的操作,如果一个一个执行,操作的工作量、确认工作量、总执行耗时都会比较大,并且容易造成遗漏,因为为了方便起见,会把一个系统所有的操作汇总成一个大促预案,在需要执行时可以一次性的批量执行。
二.预案分类
简单的说,预案可以这样分类:
三.预案配置和预案验证单
预案的具体内容各个系统都不尽相同,需要根据实际情况进行配置,通用情况来看需要注意的地方有如下:
- 确定每一个降级内容的影响面,如果影响到下游或关联系统,一定要进行同步
- 确定好验证降级是否执行的方法,是通过监控查看还是通过日志查看。如果是日志,日志的内容是否清晰明白
- 确定预案执行时间
- 确定预案回滚时间
- 确定预案回滚后的验证方法
四.预案演练
预案演练是为了验证所配置的预案是否达到了真正了期望值,在执行预案演练前要准备好预案验证单,在预案执行时对照这个list执行即可,避免出现遗漏。
由于系统服务器数量较多,在进行预案验证时,最好能够对每一个机房都进行下抽查,避免预案在某一个机房没有执行。同时预案回滚时,也最好能够对每一个机房都进行下抽查,避免某些预案没有回滚,导致影响到系统功能的不完善。