SRE实战手册

 

 

01|SRE迷思:无所不能的角色?还是运维的升级?   (2020-04-23 23:57) 编辑
02 | 系统可用性:没有故障,系统就一定是稳定的吗?   (2020-04-24 21:53) 编辑
03 | SRE切入点:选择SLI,设定SLO   (2020-04-24 22:17) 编辑
04 | 错误预算:达成稳定性目标的共识机制   (2020-04-25 11:18) 编辑
05 | 案例:落地SLO时还需要考虑哪些因素?   (2020-04-25 17:22) 编辑
06 | 故障发现:如何建设On-Call机制?   (2020-04-25 21:50) 编辑
07 故障处理:一切以恢复业务为最高优先级   (2020-04-26 14:24) 编辑
08|故障复盘:黄金三问与判定三原则   (2020-04-26 14:44) 编辑
09|案例:互联网典型的SRE组织架构是怎样的?   (2020-04-26 15:09) 编辑
10 | 经验:都有哪些高效的SRE组织协作机制?   (2020-04-26 15:14) 编辑
结束语|SRE落地历程   (2020-04-26 15:49) 编辑

posted @ 2020-04-26 16:32  元贞  阅读(649)  评论(0编辑  收藏  举报