05 2023 档案

摘要:SRE 首要任务是制定并推动达成 SLO,本文介绍 SLO 的相关实践。成为 SRE 第一步:搞定 SLO,协助制定、推动达成! 阅读全文
posted @ 2023-05-26 17:05 IT运维监控 阅读(711) 评论(0) 推荐(0) 编辑
摘要:不可能有 100% 的服务可用性,也没有必要做到 100% 的服务可用性。如何度量风险,如何制定 SLO,如何提升稳定性,如何权衡成本和产出 阅读全文
posted @ 2023-05-25 12:55 IT运维监控 阅读(214) 评论(0) 推荐(0) 编辑
摘要:夜莺( Nightingale )安装方式,不同的场景使用不用的安装方式 阅读全文
posted @ 2023-05-18 11:45 IT运维监控 阅读(867) 评论(0) 推荐(0) 编辑
摘要:SRE Google 运维解密,是 SRE 领域的启蒙之作,讲述了 Google 的 SRE 实践,SRE 就是从 Google 流传出来的。本文是读书笔记,第一篇,概述 SRE 方法论 阅读全文
posted @ 2023-05-17 14:31 IT运维监控 阅读(273) 评论(0) 推荐(0) 编辑
摘要:集成Zabbix告警到FlashDuty,获得告警降噪、智能排班、IM协同等能力 阅读全文
posted @ 2023-05-16 11:53 IT运维监控 阅读(454) 评论(0) 推荐(0) 编辑
摘要:日志,指标和分布式链路追踪这三个可观测性的传统支柱,已经是过时的,过于关注数据采集和底层数据格式,而不去关注结果(我们建设可观测性的初心和目标),这个做法实在是滑天下之大稽。by Martin Mao Gartner 把“可观测性”定义为“监控”的巨大革新,可观测性提供了数字化业务应用、创新速度、客 阅读全文
posted @ 2023-05-16 10:33 IT运维监控 阅读(278) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示