07 2020 档案
摘要:新版node_exporter监控主机对应key与之前版本有所不同,本文介绍新版node_exporter监控主机部分监控公式配置 环境查看 系统版本 软件版本 # /usr/local/prometheus/prometheus --version prometheus, version 2.20
阅读全文
摘要:环境查看 查看granfana版本 也可以使用以下方法查看版本 grafana-server -v 设置邮件发送者信息 报警granfana配置文件添加邮件配置信息 /etc/grafana/grafana.ini [smtp] #开启smtp enabled = true #邮箱发送地址及端口 h
阅读全文
摘要:Prometheus可以设置成后台启动 参考:https://www.cnblogs.com/minseo/p/13370596.html 但是其他应用程序大多使用systemctl管理启动,为统一设置Prometheus为systemctl启动 环境查看 下载prometheus 下载地址:htt
阅读全文
摘要:客观的来说 每⼀款监控⼯具 都有⾃⼰的优点缺点 并不是越 新的就⼀定越好 就拿 nagios 和 prometheus来说,虽然nagios它的年头很⽼了 ⽽且很多功能已经⽐较落后了 但是 nagios即便在今天 , 运维⼯作中 依然有它独⽴存在的意 义 ⽐如说: 我之前所在的⼀家公司,我们核⼼监控
阅读全文
摘要:本讲内容 pagerduty 注册新账号 pagerduty 创建新的service pagerduty 报警信息的设置 注册账号 https://www.pagerduty.com/sign-up/ 免费试用14天 注意:注册会获得一个自定义的二级域名用于管理,如果出现subdomain unde
阅读全文
摘要:本讲内容 Prometheus+grafana TCP等待链接监控 企 业实际使⽤ 使⽤公式 count_netstat_wait_connections ⼀个key⾜够了 gauge 数据来源: pushgateway + 脚本 其实 node_exporter 也有对应的 tcp wait 不过
阅读全文
摘要:本讲主要内容 prometheus+grafana 企业CPU监控 真实案例 prometheus+grafana 企业内存监控 真实案例 prometheus+grafana 企业硬盘/IO监控 真实案例 prometheus+grafana 企业⽹络传输 真实案例 (一)prometheus+g
阅读全文
摘要:本讲内容 Grafana 这款软件的介绍 Grafana 下载/安装/配置/运⾏ Grafana 设置数据源 连接prometheus_server Grafana 建⽴ Dashboard Grafana 创建 graph 成图 Grafana graph进阶内容 Grafana Dashboar
阅读全文
摘要:(一)编写一个exporter流程 ⾸先 不同于pushgateway, exporter是⼀个独⽴运⾏ 的采集程序 其中的功能需要有这三个部分 1) ⾃⾝是HTTP 服务器,可以响应 从外发过来的 HTTP GET 请求 2) ⾃⾝需要运⾏在后台,并可以定期触发 抓取本地的监控 数据 3) 返回给
阅读全文
摘要:第十讲内容 • pushgateway 的介绍 • pushgateway 的安装和运⾏和配置 • ⾃定义编写脚本的⽅法 发送pushgateway 采集 • 使⽤pushgateway的优缺点 (⼀) pushgateway 的介绍 pushgateway 是另⼀种采⽤被动推送的⽅式(⽽不是exp
阅读全文
摘要:第九讲内容如下 1)prometheus服务端安装和后台稳定运行 2)prometheus服务端配置文件写法 3)node_exporter安装和后台运行 4)node_exporter观察和采集数据 5)prometheus查询采集回来的各种数据 6) 使用我们之前学过的prometheus命令行
阅读全文
摘要:本讲内容 prometheus命令行格式 rate函数使用 increase函数使用 sum函数使用 (一)prometheus命令行格式 我们选一个新的key来做讲解 count_netstat_wait_connections #TCP wait_connect数 这个key值不少我们熟悉的no
阅读全文
摘要:上篇留下一个比较难的计算CPU使用率的公式 (1-((sum(increase(node_cpu{mode="idle"}[1m]))by(instance))/(sum(increase(node_cpu[1m]))by(instance))))*100 拆分并解释这个公式 举一反三计算CPU其他
阅读全文
摘要:prometheus官网下载 prometheus开始安装 prometheus启动运行 prometheus基本配置文件讲解 安装第一个个exporter -》node_exporter prometheus连接exporter获取数据 prometheus命令行入门 时间同步 ntpdate t
阅读全文
摘要:prometheus监控中,对于采集过来的数据统一称为metrics数据 metrics是一种对采样数据的总称(metrics并不代表某一种具体的数据格式 是一种对于度量计算单位的抽象) metrics数据类型 Gauges 最简单的度量指标,只有一个简单的返回值,或者叫瞬时状态,例如我们度量一个待
阅读全文
摘要:1)prometheus是什么 prometheus是一个开源系统监控和报警的工具集合,由SoundCloud创建,自从2012年诞生之后,至今已经有许多公司和组织开始使用它,这个开源项目拥有大量积极参与开发和建设的研发人员。目前已经是一个独立运行的,开源的 由各公司自行维护的监控项目。为了让项目更
阅读全文
摘要:1)介绍企业目前在监控上的各个发展阶段 早期无监控 全部都是人工盯着 服务器操作系统网络等 中前期 半自动脚本监控 利用shell脚本这种类似的形式,做最简单的监控脚本 循环登录机器 查看一些状态 之后人工记录 无报警 无自动化 无监控图形 中期企业 自动化程序/脚本/软件/监控 脚本更新换代,开始
阅读全文
摘要:参考:https://www.cnblogs.com/gomysql/p/3674030.html 1,方案介绍 本方案采用Heartbeat双机热备软件来保证数据库的高稳定性和连续性,数据的一致性由DRBD这个工具来保证。默认情况下只有一台mysql在工作,当主mysql服务器出现问题后,系统将自
阅读全文
摘要:参考:https://blog.csdn.net/wzy0623/article/details/81188814 http://www.mamicode.com/info-detail-1494631.html https://www.jianshu.com/p/12c4b3e43b65 一,He
阅读全文
摘要:参考:https://www.cnblogs.com/kevingrace/p/5740940.html 一,Drbd介绍 DRBD(Distributed ReplicatedBlock Device)是一种基于软件的,无共享,分布式块设备复制的存储解决方案,在服务器之间的对块设备(硬盘,分区,逻
阅读全文
摘要:Rabbitmq如果修改主机名hostname后重启rabbitmq会无法启动报错 需要按照如下配置才能正确修改 环境查看 修改主机名 例如原主机名为prd-rabbitmq需要修改成prd-rabbitmq01 hostname prd-rabbitmq01 echo prd-rabbitmq01
阅读全文
摘要:参考:https://www.cnblogs.com/shihaiming/p/11014257.html https://www.cnblogs.com/knowledgesea/p/6535766.html Rabbitmq简介 RabbiMQ是用Erang开发的,集群非常方便,因为Erlang
阅读全文
摘要:参考:https://developer.51cto.com/art/201909/603565.htm https://www.jianshu.com/p/91f9d9ec374f cadvisor是google创建的用于监控icmtfy容器资源使用情况和性能的软件,cadvisor在宿主机上以容
阅读全文
摘要:环境查看 docker版本 # docker info Client: Debug Mode: false Server: Containers: 26 Running: 15 Paused: 0 Stopped: 11 Images: 312 Server Version: 19.03.8 Sto
阅读全文
摘要:参考:https://blog.csdn.net/StanleyWm_/article/details/101704707 Ubuntu20.14使用命令date设置时间不生效,设置完以后时间没有改 环境查看 设置时间 date -s "20101111 11:11:11" 设置时间未生效 原因Ub
阅读全文
摘要:k8s集群启动es集群,启动了4个副本,其中1个副本调度到node01,1个副本调度到node02 从主机无法ping通到node01的Pod可以同node02的Pod 查看node01的ip发现flanneld和docker的ip地址不在同一网段 重启flanneld和docker 注意:需要先重
阅读全文