摘要:
上面的步骤虽然是有先后顺序的,但是在真正执行时并不是单向的,而是会有跳跃或者反复的 检讨总结非常重要,确保不要犯重复的问题 信任但需要确认,一定要确认,一定要确认,一定要确认, 不放过任何一个预料之外的现象,要找到问题的根源并予以解决,而不能有侥幸心理 阅读全文
摘要:
老话讲:失败是成功之母,然而如果下一次的尝试时还是用上次失败时的老方法大概率还是要失败。因而更确切的说法是检讨是成功之母,失败了但进行了检讨找到了问题的根源,然后进行修正,用修正后的方法再次进行尝试获得成功的可能性将会大大增加。 复盘的作用就是如此,一方面总结在大促准备过程中碰到的问题,避免下次再犯 阅读全文
摘要:
经过了前面的各种准备,大促终于到了,在大促当天要关注的事情也是相当多的,需要有条不紊的按部就班的执行。 1.值班安排 大促期间执行、验证、观察的事项还是比较多的,最好是有两个人进行主备,每一件事情最好能够double check,并且做好事项的分工。 2.应用服务器磁盘空间清理|重启 系统在运行过程 阅读全文
摘要:
压测分为全链路压测和单系统服务接口压测两种,对于全链路压测要准备的事情和要改造的东西是特别多的,是一个相对庞大的系统工程,大致业务架构如下,可以单独列出一个系列来讲,这里只讲单系统的服务接口压测。 压测可以选择的框架有多种,可以根据系统所采用的代码、熟悉程度等选择一个,更好的方式是在开源的压测框架之 阅读全文
摘要:
一.为什么要有预案 事有轻重缓急,对于一个系统也是如此,在大促期间通常会将系统中一些不太重要的业务或操作给降级,比如详情日志打印、营销类的消息、业务控制等,将资源用于大促中不得不操作的业务上;或者在大促过程中进行链路的切换,比如启用近端、启用异步执行或者合并执行等。一个系统通常有多个这样的操作,如果 阅读全文
摘要:
压测是准备大促过程中至关重要的一个环节,在真正开始压测之前系统通常要做一定的改造,以使得压测请求的代码执行路径更符合实际情况,主要进行的改造和准备主要有如下内容 1、存储准备 对于压测服务中涉及到db(msyql、hbase、ob)的系统,在压测前需要联系DBA、PE先准备好所需的压测表。对于缓存( 阅读全文
摘要:
限流主要是针对非核心服务调用者进行的。 1、确定限流对象 原则上,大促核心链路上的服务都要配置限流,以免大促期间的流量超过预估值把服务器压垮。同时还要考虑出口限流,主要是对db的限流,配置一个读写总流,以避免把服务器压垮。 2、确定限流实现方式 限流实现方式主要有两种: 方法1的好处是简单,缺点是限 阅读全文
摘要:
这里的资源估算,主要是指系统使用的应用服务器数量的估算,对于存储及中间件的机器需求对应的pe及dba会进行估算,我们主要是进行验证。 应用服务器的估算简单的说就是:服务调用总量/单机容量。然而在真正操作时需要注意下面因素: 大多数系统是分zone部署的,因而需要把总的服务调用量按照服务分布转换为对应 阅读全文
摘要:
一、接口调用统计 询问上游调用方或总pm在大促期间对我们系统对应服务的调用峰值及峰值发生时间、是否为强依赖。 编号 服务 峰值 峰值时间 所在zone 场景 调用方 是否强依赖 编号 服务 峰值 峰值时间 所在zone 场景 调用方 是否强依赖 编号 服务 峰值 峰值时间 所在zone 场景 调用方 阅读全文
摘要:
一、大促无小事 大促是服务端系统的头等大事,是自身技术水平、业务了解程度最好的检验场,也是扩大自身影响力最好的舞台。在大促准备过程中对于任何不符合预期的动态需要百分之百的重视,确保了解背后的原因,评估其影响,如果不能彻底消除,必须要有相应的预案和对策,并且这些预案和对策是经过验证可行的。 二、信任但 阅读全文