摘要: 前言 前面介绍了SRE的基础,包括SLI和SLO以及Error Budget(错误预算)。其中: SLI是衡量系统稳定性的指标; SLO是每个指标对应的衡量目标; SLO转化为错误预算(更直观便与量化); 转化后做稳定性提升保障工作,就是想办法不要把错误预算消耗完,或不能把错误预算快速大量消耗掉。 阅读全文
posted @ 2022-02-14 22:37 老_张 阅读(1292) 评论(0) 推荐(0) 编辑
摘要: 前言 这篇文章是《SRE实战手册》学习笔记的第二篇,理解SRE之后,就要找到切入点来落地。 理解SRE中的指标和目标 SRE强调稳定性,一般是看整体的系统情况,也就是常说的"3个9"、"4个9"这样可量化的数字。 这个“确定成功请求条件,设定达成占比目标”的过程,在SRE中就是设定稳定性衡量标准的S 阅读全文
posted @ 2022-02-14 00:24 老_张 阅读(913) 评论(0) 推荐(0) 编辑