上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 93 下一页
摘要: 客观的来说 每⼀款监控⼯具 都有⾃⼰的优点缺点 并不是越 新的就⼀定越好 就拿 nagios 和 prometheus来说,虽然nagios它的年头很⽼了 ⽽且很多功能已经⽐较落后了 但是 nagios即便在今天 , 运维⼯作中 依然有它独⽴存在的意 义 ⽐如说: 我之前所在的⼀家公司,我们核⼼监控 阅读全文
posted @ 2020-07-28 16:30 minseo 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 本讲内容 pagerduty 注册新账号 pagerduty 创建新的service pagerduty 报警信息的设置 注册账号 https://www.pagerduty.com/sign-up/ 免费试用14天 注意:注册会获得一个自定义的二级域名用于管理,如果出现subdomain unde 阅读全文
posted @ 2020-07-28 13:37 minseo 阅读(966) 评论(0) 推荐(0) 编辑
摘要: 本讲内容 Prometheus+grafana TCP等待链接监控 企 业实际使⽤ 使⽤公式 count_netstat_wait_connections ⼀个key⾜够了 gauge 数据来源: pushgateway + 脚本 其实 node_exporter 也有对应的 tcp wait 不过 阅读全文
posted @ 2020-07-27 15:07 minseo 阅读(738) 评论(0) 推荐(0) 编辑
摘要: 本讲主要内容 prometheus+grafana 企业CPU监控 真实案例 prometheus+grafana 企业内存监控 真实案例 prometheus+grafana 企业硬盘/IO监控 真实案例 prometheus+grafana 企业⽹络传输 真实案例 (一)prometheus+g 阅读全文
posted @ 2020-07-27 14:45 minseo 阅读(413) 评论(0) 推荐(0) 编辑
摘要: 本讲内容 Grafana 这款软件的介绍 Grafana 下载/安装/配置/运⾏ Grafana 设置数据源 连接prometheus_server Grafana 建⽴ Dashboard Grafana 创建 graph 成图 Grafana graph进阶内容 Grafana Dashboar 阅读全文
posted @ 2020-07-27 11:48 minseo 阅读(705) 评论(0) 推荐(0) 编辑
摘要: (一)编写一个exporter流程 ⾸先 不同于pushgateway, exporter是⼀个独⽴运⾏ 的采集程序 其中的功能需要有这三个部分 1) ⾃⾝是HTTP 服务器,可以响应 从外发过来的 HTTP GET 请求 2) ⾃⾝需要运⾏在后台,并可以定期触发 抓取本地的监控 数据 3) 返回给 阅读全文
posted @ 2020-07-27 09:45 minseo 阅读(308) 评论(0) 推荐(0) 编辑
摘要: 第十讲内容 • pushgateway 的介绍 • pushgateway 的安装和运⾏和配置 • ⾃定义编写脚本的⽅法 发送pushgateway 采集 • 使⽤pushgateway的优缺点 (⼀) pushgateway 的介绍 pushgateway 是另⼀种采⽤被动推送的⽅式(⽽不是exp 阅读全文
posted @ 2020-07-24 18:07 minseo 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 第九讲内容如下 1)prometheus服务端安装和后台稳定运行 2)prometheus服务端配置文件写法 3)node_exporter安装和后台运行 4)node_exporter观察和采集数据 5)prometheus查询采集回来的各种数据 6) 使用我们之前学过的prometheus命令行 阅读全文
posted @ 2020-07-24 10:33 minseo 阅读(818) 评论(0) 推荐(0) 编辑
摘要: 本讲内容 prometheus命令行格式 rate函数使用 increase函数使用 sum函数使用 (一)prometheus命令行格式 我们选一个新的key来做讲解 count_netstat_wait_connections #TCP wait_connect数 这个key值不少我们熟悉的no 阅读全文
posted @ 2020-07-23 17:47 minseo 阅读(2018) 评论(0) 推荐(0) 编辑
摘要: 上篇留下一个比较难的计算CPU使用率的公式 (1-((sum(increase(node_cpu{mode="idle"}[1m]))by(instance))/(sum(increase(node_cpu[1m]))by(instance))))*100 拆分并解释这个公式 举一反三计算CPU其他 阅读全文
posted @ 2020-07-23 11:07 minseo 阅读(758) 评论(0) 推荐(0) 编辑
上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 93 下一页