随笔分类 -  zabbix,Prometheus,grafana

摘要:redis监控,prometheus需要使用redis_exporter客户端。 这里我们采用docker方式部署,既可以部署在redis所在服务器,也可以部署在其他机器: docker镜像地址:https://hub.docker.com/r/oliver006/redis_exporter/ta 阅读全文
posted @ 2020-05-05 17:05 Oops!# 阅读(2496) 评论(0) 推荐(0) 编辑
摘要:安装mysql exporter Prometheus MySQL Exporter是一个客户端应用程序,用于获取MySQL指标并导出到Prometheus Server。 在这里,我们将介绍如何在数据库服务器上配置Prometheus MySQL Exporter程序,包括MySQL MariaD 阅读全文
posted @ 2020-05-05 13:45 Oops!# 阅读(4379) 评论(0) 推荐(0) 编辑
摘要:官方参考:https://github.com/prometheus/node_exporter#using-docker node_exporter设计用于监控主机系统。不建议将其部署为Docker容器,因为它需要访问主机系统。请注意,您要监视的任何非根安装点都需要绑定到容器中。如果启动容器以进行 阅读全文
posted @ 2020-05-04 23:49 Oops!# 阅读(9905) 评论(0) 推荐(1) 编辑
摘要:概述 已经有了cadvisor、heapster(metric server),几乎容器运行的所有指标都能拿到,但是下面这种情况却无能为力: 我调度了多少个replicas?现在可用的有几个? 多少个Pod是running/stopped/terminated状态? Pod重启了多少次? 我有多少j 阅读全文
posted @ 2020-05-04 22:42 Oops!# 阅读(1641) 评论(0) 推荐(0) 编辑
摘要:Silence静默配置的作用类似于Zabbix中的Maintenance维护功能,可以配置一个时间区间和相关规则,符合该配置的事件将不会进行告警。比如明确凌晨会暂停服务,这个时候就可以提前设置好静默规则,减少不必要的告警骚扰。Prometheus的Silence规则只需要通过AlertManager 阅读全文
posted @ 2020-03-13 11:38 Oops!# 阅读(3130) 评论(1) 推荐(0) 编辑
摘要:Monit是一个跨平台的用来监控Unix/linux系统(比如Linux、BSD、OSX、Solaris)的工具。Monit特别易于安装,而且非常轻量级(只有500KB大小),并且不依赖任何第三方程序、插件或者库。 Monit可以监控服务器进程状态、HTTP/TCP状态码、服务器资源变化、文件系统变 阅读全文
posted @ 2020-01-05 00:08 Oops!# 阅读(883) 评论(0) 推荐(0) 编辑
摘要:若k8s集群job状态出现error , 脚本自动kill 掉自己的 montior进程, 通过阿里云的云监控进程监控来触发报警 阿里云云监控 进程监控 文档 https://www.cnblogs.com/weifeng1463/p/11591796.html 阅读全文
posted @ 2019-11-01 14:04 Oops!# 阅读(918) 评论(0) 推荐(0) 编辑
摘要:若专线对端ping 的延时 rtt 为0 , 脚本自动kill 掉自己的 montior进程, 通过阿里云的云监控进程监控来触发报警 阿里云云监控 进程监控 文档 https://www.cnblogs.com/weifeng1463/p/11591796.html 阅读全文
posted @ 2019-10-31 15:26 Oops!# 阅读(372) 评论(0) 推荐(0) 编辑
摘要:事件监控是Kubernetes中的另一种监控方式,可以弥补资源监控在实时性、准确性和场景上的缺欠。Kubernetes的架构设计是基于状态机的,不同的状态之间进行转换则会生成相应的事件,正常的状态之间转换会生成Normal等级的事件,正常状态与异常状态之间的转换会生成Warning等级的事件。开发者 阅读全文
posted @ 2019-10-23 15:29 Oops!# 阅读(2357) 评论(0) 推荐(0) 编辑
摘要:进程监控默认为您采集最近一段时间内活跃进程的CPU使用率、内存使用率以及进程打开文件数。如果您添加了进程关键字,还可以采集包含关键字的进程个数。 查看活跃进程消耗 云监控插件会每分钟统计一次CPU消耗Top5 的进程,记录 Top5 进程的CPU使用率、内存使用率和打开文件数。 进程的CPU使用率与 阅读全文
posted @ 2019-09-26 14:48 Oops!# 阅读(1354) 评论(0) 推荐(0) 编辑
摘要:配置zabbix客户端配置文件 vim /etc/zabbix/zabbix_agentd.conf 添加 Include=/etc/zabbix/zabbix_agentd.d/ zabbix 客户端重新启动 zabbix-agent [root@compute zabbix_agentd.d]# 阅读全文
posted @ 2019-03-07 11:06 Oops!# 阅读(1736) 评论(0) 推荐(0) 编辑
摘要:现有一需求去curl 在香港的一个接口, 返回值有时正常有时报错 connection reset by peer . 思路: 若 执行成功 $?返回 0 , 不成功则返回其他数字 再在 zabbix界面添加 item , trigger , graphs 等设置。 阅读全文
posted @ 2018-11-27 14:11 Oops!# 阅读(3276) 评论(0) 推荐(0) 编辑
摘要:Lpop key 返回值: 列表的头元素。 当key 不存在时, 返回 nil . 需求: 开发在执行 lpop key 时, 出现问题 , 执行语句卡住, 不能执行下去 , 需对此做一个监测 由于返回值 nil (这里redis的nil 类似于 null ), 不能用 grep 正则去过滤 , 则 阅读全文
posted @ 2018-11-26 15:35 Oops!# 阅读(7418) 评论(0) 推荐(1) 编辑
摘要:配置zabbix客户端配置文件 vim /etc/zabbix/zabbix_agentd.conf 添加 Include=/etc/zabbix/zabbix_agentd.d/ zabbix 客户端重新启动 zabbix-agent [root@compute zabbix_agentd.d]# 阅读全文
posted @ 2018-11-02 16:34 Oops!# 阅读(951) 评论(0) 推荐(0) 编辑
摘要:实际示例: 最近5分钟值等于1的个数小于一次的话触发报警 香港Ecs到redis代理连接正常则返回1 , 若连续5次都没有返回1 则触发报警。 最近2分钟 terminating 的个数大于3个 出现的情况 大于3次的话 触发报警 (30秒 做一次检查,2分钟共检测4次 ) compass 出现te 阅读全文
posted @ 2018-10-29 16:42 Oops!# 阅读(977) 评论(0) 推荐(0) 编辑
摘要:示例将数据盘挂载到 /mnt目录 , 对 /mnt目录进程容量监控 item 添加对 /mnt 目录的监控项 tragger 添加触发项 这样完成对一个数据盘磁盘容量的监控 阅读全文
posted @ 2018-10-04 22:30 Oops!# 阅读(8215) 评论(2) 推荐(0) 编辑
摘要:I'm trying to install zabbix on a new (virtual) server. But i have troubles with the zabbix_agentd on the zabbix server. I get the error below and don 阅读全文
posted @ 2018-07-18 19:06 Oops!# 阅读(3944) 评论(0) 推荐(0) 编辑
摘要:方法二:使用mysql参数的方法 mysql -u$user -p$pass -D $db -e "select host from user;"当然,可以通过将传参的方式来传递 -e 后面的语句。 使用示例: 阅读全文
posted @ 2018-07-18 16:51 Oops!# 阅读(1370) 评论(0) 推荐(0) 编辑
摘要:zabbix_get 找不到命令是因为没有安装上zabbix_get ,解决办法: 1.yum list all |grep zabbix 返回一个列表,表中出现 zabbix-get.x86_84 2.yum install zabbix-get.x86_64 zabbix_get 安装成功 阅读全文
posted @ 2018-07-18 16:43 Oops!# 阅读(8554) 评论(0) 推荐(0) 编辑
摘要:2 Trigger expression Overview The expressions used in triggers are very flexible. You can use them to create complex logical tests regarding monitored 阅读全文
posted @ 2018-07-17 15:41 Oops!# 阅读(2419) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示