09 2024 档案

摘要:本文是Datadog“高效监控”系列的第一篇,后面还会有第二篇《针对重要事项发出警报》和《调查性能问题》。 监控数据有多种形式 - 一些系统不断地输出数据,而另一些系统仅在罕见事件发生时才产生数据。有些数据主要用于识别发现问题、有些数据主要用于调查问题。更宽泛地说,监控数据是观察系统内部运行情况的必 阅读全文
posted @ 2024-09-14 09:51 IT运维监控 阅读(180) 评论(0) 推荐(0) 编辑
摘要:在线服务的稳定性保障一直是运维和技术部门的核心工作之一。但时至今日,这个方向实际仍然有很多基本的概念都没有对齐。今天这篇文章就罗列下那些混淆不清的概念,期望有一天大家沟通时不是鸡同鸭讲,各说各话。 误解一:服务可用性 听过很多技术分享,看过很多平台的承诺,上来都是讲我们的服务稳定性99.9xx%,但 阅读全文
posted @ 2024-09-06 15:07 IT运维监控 阅读(53) 评论(0) 推荐(0) 编辑
摘要:益丰大药房是全国大型药品零售连锁企业(中国沪市主板上市连锁药房),专注医药零售行业23载, 市值稳居国内上市连锁药店前列/中国上市公司500强。 益丰有体量庞大的研发运维团队,有体量庞大的 IT 设施和服务,为了能够更好的监控这些设施和服务,益丰在多年前就开始建设监控系统,本文分享益丰的监控升级之路 阅读全文
posted @ 2024-09-04 16:56 IT运维监控 阅读(54) 评论(0) 推荐(0) 编辑
摘要:市面上已经有很多开源、商业的可观测性类产品,比如 Zabbix、Prometheus、Nightingale、SigNoz、SkyWalking、ELK 等等,而且各类云厂商也会提供自己的可观测性套件,有些规划混乱的云厂商甚至会提供功能重叠的多套产品,这加剧了企业数据孤岛的现状。来看两组数据: 据不 阅读全文
posted @ 2024-09-03 11:07 IT运维监控 阅读(79) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示