摘要: 如果您从事软件开发、 SRE或DevOps工作,您可能听说过可观察性、遥测和跟踪等术语。这些概念对于理解应用程序在生产环境中的行为至关重要,并且它们是现代软件开发实践的重要组成部分。 您可能还听说过在可观测性方面提到过 OpenTelemetry。在本文中,我们将介绍 OpenTelemetry 1 阅读全文
posted @ 2024-12-05 09:36 IT运维监控 阅读(91) 评论(0) 推荐(0) 编辑
摘要: 这是 MongoDB 监控系列文章的第七篇,前面几篇文章的链接如下: MongoDB 监控(一) MongoDB 监控(二) MongoDB 监控(三) MongoDB 监控(四) MongoDB 监控(五) MongoDB 监控(六) 按照前面系列文章,我们已经采集到 MongoDB 的监控数据了 阅读全文
posted @ 2024-12-02 18:05 IT运维监控 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 夜莺监控(Nightingale)已经内置支持了邮件、钉钉、飞书、企微等多种通知机制,但是没有内置支持电话、短信等方式,是因为邮件、钉钉、企微、飞书等方式是协议固定的,但是电话、短信的通知方式,各家不同,一个是短信通道供应商不同,一个是各家封装的电话、短信接口不同,所以夜莺没有内置支持。 不过好在夜 阅读全文
posted @ 2024-11-28 16:13 IT运维监控 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 夜莺监控 Nightingale 发布了 v7.7 版本,这是 v7 系列的最后一个版本,保守主义者可以放心上车了,v7.7 主要是做了一些小修小改,增强了使用体验,下周开始,启动 v8 版本的开发。v8 版本会更让人激动,会重构通知逻辑,支持 ElasticSearch、ClickHouse 等数 阅读全文
posted @ 2024-11-18 15:00 IT运维监控 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 开源的监控产品有很多,其中最知名的,当属早期的 Zabbix 和现在的 Prometheus。Zabbix 是 2001 年发布的,至今已经 20 多年,很多细节打磨的相当到位,Prometheus 是 2014 年发布的,相对年轻,依托于之前 Google Borgmon 的先进经验和灵感,Pro 阅读全文
posted @ 2024-11-07 15:25 IT运维监控 阅读(137) 评论(0) 推荐(0) 编辑
摘要: Fluentbit 是非常流行的日志采集器,作为 Fluentd 的子项目,是 CNCF 主推的项目,本文以夜莺的日志举例,使用 Fluentbit 采集,并直接写入 ElasticSearch,最终使用 Kibana 查看。借此实践过程,让读者熟悉 Fluentbit 的使用。 测试环境介绍 Ma 阅读全文
posted @ 2024-11-05 10:59 IT运维监控 阅读(57) 评论(0) 推荐(0) 编辑
摘要: VictoriaMetrics 中文教程系列文章: VictoriaMetrics 中文教程(01)简介 VictoriaMetrics 中文教程(02)安装 VictoriaMetrics 中文教程(03)如何配置 Prometheus 使其把数据远程写入 VictoriaMetrics Vict 阅读全文
posted @ 2024-10-29 07:39 IT运维监控 阅读(218) 评论(0) 推荐(1) 编辑
摘要: 夜莺开源项目于国庆前夕发布了 v7.4.1 版本,修复了一些 bug,同时也带来了一些新功能。其中最重要的一个功能是:机器支持挂载到多个业务组了。本文将介绍几个重要的变更。 所有变更点 feat: 左侧栏业务组新设计 feat: 机器支持了绑定到多个业务组,机器混部的场景,管理机器更加方便了 fea 阅读全文
posted @ 2024-10-08 14:37 IT运维监控 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 本文是Datadog“高效监控”系列的第一篇,后面还会有第二篇《针对重要事项发出警报》和《调查性能问题》。 监控数据有多种形式 - 一些系统不断地输出数据,而另一些系统仅在罕见事件发生时才产生数据。有些数据主要用于识别发现问题、有些数据主要用于调查问题。更宽泛地说,监控数据是观察系统内部运行情况的必 阅读全文
posted @ 2024-09-14 09:51 IT运维监控 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 在线服务的稳定性保障一直是运维和技术部门的核心工作之一。但时至今日,这个方向实际仍然有很多基本的概念都没有对齐。今天这篇文章就罗列下那些混淆不清的概念,期望有一天大家沟通时不是鸡同鸭讲,各说各话。 误解一:服务可用性 听过很多技术分享,看过很多平台的承诺,上来都是讲我们的服务稳定性99.9xx%,但 阅读全文
posted @ 2024-09-06 15:07 IT运维监控 阅读(40) 评论(0) 推荐(0) 编辑