CaseStudy规范
CaseStudy规范概括
什么情况要写:线上问题客诉数量超过3个,并且RD操作回滚或发版修复了此问题
谁来写:推动或操作回滚、发版修复了此问题的RD
复盘时间要求:故障在处理结束后,3天之内写完COE并发出链接,一周之内组织会议进行复盘
为什么要写CaseStudy
目的:避免再次发生,消灭潜在隐患
如何写CaseStudy
方式:
- 摆正心态(不为了追责,也不要担心得罪他人)
- 过程记录(时间和事件)
- 影响评估(影响范围和公司损失)
- 原因分析(深入分析原因,5why分析法)
- 事后改进(任务TODO,SMART原则)
- 机制沉淀(最佳实践、SOP、checklist等)
- 分享学习(对内自我提升)
- 他人借鉴(对外共同进步)
什么情况要写CaseStudy
- 用户反馈的线上问题,影响了用户的正常使用,或造成公司的损失
- (客诉数量超过3个)
- RD操作了系统回滚,回滚之后用户恢复正常使用,或停止了损失产生
原则上:任何满足以上条件的都要写
实际中:由leader判断是否要写
建议是:如果故障影响比较小,可以写的简单一些,只做简单记录,否则正常写
CaseStudy的时间要求
- 故障在处理结束后,责任团队需要在
- 3天之内
- 完成CaseStudy撰写并发到群里,
- 一周之内
- 组织会议进行复盘
CaseStudy需要通知哪些人
- 影响的业务方(PM)
- 相关客服人员
- 相关值班群、应急群
- 监督人(架构组山竹、QA生地)
- 其它相关人
CaseStudy需要哪些人参与复盘
- 当事人RD
- 影响的业务方(PM)
- 对应的QA
- 监督人(架构组山竹、QA生地)
- 其它相关人
CaseStudy撰写模板
COE系统:
后续CaseStudy的编写,转移到天眼的COE系统,进入系统,点击创建COE,开始编写:
文档位置:
对应季度子目录下,比如2019年Q3的需要写在 2019年Q3 目录下。
标题模板:
- 页面标题模版“CaseStudy-YYYYMMDD-团队-故障标题”
- 故障标题要具体,如写“服务中断10分钟”,而不是“服务故障”,如写“导致用户不能下单”,而不是“订单系统报错”
内容模板:
需要按照模板来写,具体模板:【模板】CaseStudy-YYYYMMDD-团队-故障标题
故障定级