01 2024 档案

摘要:当谈到并发时,许多编程语言都采用共享内存/状态模型。然而,Go 通过实现 Communicating Sequential Processes(CSP)而与众不同。在 CSP 中,程序由不共享状态的并行处理器组成;相反,他们使用 Channel 来沟通和同步他们的行动。因此,对于有兴趣采用 Go 的 阅读全文
posted @ 2024-01-30 12:02 IT运维监控 阅读(36) 评论(0) 推荐(0) 编辑
摘要:前言 对于数据库、中间件的监控,目前社区里最为完善的就是 Prometheus 生态的各个 Exporter,不过这些 Exporter 比较分散,不好管理,如果有很多目标实例需要监控,就要部署很多个 Exporter,要是能有一个大一统的 Exporter,具备所有这些 Exporter 的能力就 阅读全文
posted @ 2024-01-29 19:48 IT运维监控 阅读(163) 评论(0) 推荐(0) 编辑
摘要:笔者去年在极客时间发布了一个专栏《运维监控系统实战笔记》,很多朋友借此梳理了较为体系化的运维监控系统知识,但是限于专栏篇幅,有些手把手实操类的内容没有办法展开,另外时隔一年,监控系统的技术栈也有了一些变化,所以笔者决定在这里把这些内容补充完整。 监控系统的典型架构 对于一些前置背景知识、名词解释、行 阅读全文
posted @ 2024-01-25 12:15 IT运维监控 阅读(126) 评论(0) 推荐(0) 编辑
摘要:熟悉夜莺的小伙伴都知道夜莺分为开源版、专业版、企业版,三个版本良性发展。近期夜莺团队发布了 v6.7 版本,把机器Metadata管理功能推送到了开源版,下面是该功能的简单介绍。 如上图,机器列表页面的机器标识部分,加了超链接支持点击,点击之后会弹出一个侧拉板,展示机器的 metadata 信息,如 阅读全文
posted @ 2024-01-24 19:14 IT运维监控 阅读(156) 评论(0) 推荐(0) 编辑
摘要:通过深入分析和解决企业在可观测性和稳定性保障方面的挑战,Flashcat 提出了“灭火图”这一关键概念。 灭火图以服务/模块/基础组件/基础设施等为维度,以聚合的视角实时度量某个特定维度的可用性(典型指标包括时延、流量、错误、饱和度),并为该可用性指标自动设定合理的阈值,可以回溯历史上的指定时间点的 阅读全文
posted @ 2024-01-23 13:13 IT运维监控 阅读(329) 评论(0) 推荐(0) 编辑
摘要:在 Google SRE 的著作《Google运维解密》(原作名:Site Reliability Engineering: How Google Runs Production Systems)中,Google SRE 的关键成员们几乎不惜用了三个章节的篇幅描述了在 Google 他们是如何 On 阅读全文
posted @ 2024-01-19 17:01 IT运维监控 阅读(99) 评论(0) 推荐(0) 编辑
摘要:Oracle 数据库在行业内应用广泛,通常存放的非常重要的数据,监控是必不可少的,本文使用 Cprobe 采集 Oracle 监控数据,极致简单,分享给大家。 安装配置 Oracle 简单起见,我使用 Docker 启动 Oracle,命令如下: docker run -d --name oracl 阅读全文
posted @ 2024-01-18 18:00 IT运维监控 阅读(138) 评论(0) 推荐(0) 编辑
摘要:FlashDuty:一站式告警响应平台,前往此地址免费体验! 值班管理 UI 交互优化 【个人日程】从头像下拉菜单调整到值班列表页面,快速查看个人值班日程 【值班列表】支持原地预览最近一周值班情况,包括当前和下一阶段值班人 【值班详情】支持日历模式与时间线模式切换,查看月度计划更方便 【规则调整】支 阅读全文
posted @ 2024-01-17 10:40 IT运维监控 阅读(76) 评论(0) 推荐(0) 编辑
摘要:什么是可观测性? 可观测性(Observability)是一种软件开发和系统构建的哲学,是对系统内部状态及行为的度量和推断能力,通常包括日志、指标、链路追踪等多个度量维度。也就是说,在软件开发和运维领域中,可观测性是指对于一个复杂的系统,能够通过监控、日志、指标、追踪等手段,快速地发现、诊断、解决问 阅读全文
posted @ 2024-01-16 15:51 IT运维监控 阅读(250) 评论(0) 推荐(0) 编辑
摘要:需求背景 监控数据采集领域,比如 Prometheus 生态有非常多的 Exporter,虽然生态繁荣,但是无法达到开箱即用的大一统体验,Exporter 体系的核心问题有: 良莠不齐:有的 Exporter 写的非常棒,有的则并不完善,有些监控类别甚至有多个 Exporter,选择困难 写法各异: 阅读全文
posted @ 2024-01-13 10:53 IT运维监控 阅读(111) 评论(0) 推荐(0) 编辑
摘要:author:longzhuquan 背景 随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多。虽然每套 TiDB 集群均有两个详细的监控 Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消 阅读全文
posted @ 2024-01-12 10:29 IT运维监控 阅读(69) 评论(0) 推荐(0) 编辑
摘要:author:longzhuquan 背景 随着公司XC改造步伐的前进,越来越多的业务选择 TiDB,由于各个业务之间需要物理隔离,避免不了的 TiDB 集群数量越来越多。虽然每套 TiDB 集群均有两个详细的监控 Dashboard、Grafana,但对于运维来说几十套集群的监控、告警、巡检均需消 阅读全文
posted @ 2024-01-11 10:36 IT运维监控 阅读(75) 评论(0) 推荐(0) 编辑
摘要:Flashduty 作为功能完备的事件OnCall中心,可以接入云上、云下不同监控系统,统一做告警降噪分派、认领升级、排班协同,已经得到众多先进企业的认可。我们采访了一些典型客户代表,了解他们的痛点、选型考虑和未来展望,集成本系列文章,以飨读者。 本次有幸在邹老板支持下访谈到途游资深运维工程师高工, 阅读全文
posted @ 2024-01-10 10:14 IT运维监控 阅读(177) 评论(0) 推荐(0) 编辑
摘要:Flashduty 作为功能完备的事件OnCall中心,可以接入云上、云下不同监控系统,统一做告警降噪分派、认领升级、排班协同,已经得到众多先进企业的认可。我们采访了一些典型客户代表,了解他们的痛点、选型考虑和未来展望,集成本系列文章,以飨读者。 本次采访的是来自益丰大药房的高级运维工程师张望。益丰 阅读全文
posted @ 2024-01-08 11:39 IT运维监控 阅读(133) 评论(0) 推荐(0) 编辑
摘要:我想搞一个新的开源项目,想邀请同道中人一起来搞。目标是做一个探针式监控采集器,使用 Go 语言编写,欢迎感兴趣的朋友一起来搞。 名词解释 探针式监控采集器,这里的探针式是啥意思? 这是我的个人叫法,监控数据采集器姑且可以分成两种,一种是本地式,部署到要监控的目标机器上,采集 CPU、内存、磁盘、IO 阅读全文
posted @ 2024-01-04 12:01 IT运维监控 阅读(60) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示