随笔分类 - 监控相关
监控平台或组件
摘要:CPU性能评估 vmstat命令 作用:可以对操作系统的内存信息、进程状态、CPU活动等进行监控。 语法:vmstat(选项)(参数) 选项 -a:显示活动内页; -f:显示启动后创建的进程总数; -m:显示slab信息; -n:头信息仅显示一次; -s:以表格方式显示事件计数器和内存状态; -d:
阅读全文
摘要:一 Zabbix简介 1.1 概述 Zabbix是一个企业级的高度集成开源监控软件,提供分布式监控解决方案。可以用来监控设备、服务等可用性和性能。 1.2 所支持监控方式 目前由zabbix提供包括但不限于以下事项类型的支持 二 Zabbix优势 自由开放源代码产品,可以对其进行任意修改和二次开发,
阅读全文
摘要:一 监控架构 1.1 组成 客户端:数据采集部分 服务端:数据存储分析告警展示 1.2 采集模式 被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境。 主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境。 1.4 协议 专用客户端采集 公用协议
阅读全文
摘要:一 前期准备 节点 IP 备注 falcon 私网:172.24.10.95 临时公网:120.132.23.107 Open-Falcon服务端 node01 172.24.10.216 被监控端 节点 IP 备注 falcon 私网:172.24.10.95 临时公网:120.132.23.10
阅读全文
摘要:一 Open-Falcon简介监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的数据用于追查定位问题。监控系统作为一个成熟的运维产品,相对成熟的解决方案有Nigos、Zabbix、Cacti。随着业务规模的持续快速增长,监控的对象也越来越多,越来越复杂,监控系统的使用对象也从最初少数的几个SRE,扩大为更多的DEVS,SRE。这时候,监控系统的容量和用...
阅读全文
摘要:一 前期规划 1.1 Zabbix架构图 1.2 其他规划 组件 类型 版本 备注 Zabbix Web zabbix-web-apache-mysql镜像 wordpress:latest 也可采用zabbix-web-nginx-mysql镜像 数据库 MySQL数据库镜像 mysql:5.7
阅读全文
摘要:一 分布式Zabbix介绍 zabbix proxy 可以代替 zabbix server 收集性能和可用性数据,然后把数据汇报给 zabbix server,并且在一定程度上分担了zabbix server 的压力。 此外,当所有agents和proxy报告给一个Zabbix server并且所有
阅读全文
摘要:一 中文乱码处理 1.1 现象 1.2 解决方法 将任意一中文字体上传至/usr/share/zabbix/fonts,如微软雅黑。 重启zabbix-server,并重新设置为中文即可。 注意:若字体后缀为大写,需要改为小写,后缀名应为ttf。 二 内存溢出问题 随着监控的主机越来越多,zabbi
阅读全文
摘要:一 数据库备份及恢复 1.1:全库备份 注意:若数据库过大,建议采用bzip2压缩进行备份。 1.2:分开备份 Zabbix数据库中有很多的多,大体上分为存放监控数据的表和配置的表两种。 数据表有: alerts auditlog events history history_log history
阅读全文
摘要:一 调优相关对应项 Zabbix busy trapper processes, in % StartTrappers=5 Zabbix busy poller processes, in % StartPollers=5 Zabbix busy ipmi poller processes, in
阅读全文
摘要:一 SNMP介绍及配置 1.1 SNMP介绍参考其他笔记 1.2 SNMP配置 注意:SW2类似配置即可,建议不要配置write团体名。 二 添加SNMP设备 2.1 安装snmp相关组件 2.2 添加设备 #如图所示添加SNMP设备,检查相关IP和端口,依次添加第二台交换机。 注意:建议移除Age
阅读全文
摘要:一 等级告警 告警升级可以对告警结果按自定义的时间段进行进行消息发送,并执行命令,形成一个梯度的告警处理。 二 按时间自定义告警梯度 2.1 添加时间发生的时间戳和发送时间 2.2 设置三个等级梯度 第一梯度,1、2步,发送给admin用户,时间间隔为60s,发送两次,直到故障恢复。 第二梯度,3、
阅读全文
摘要:一 创建Media Administration >Media types >Create Media Type 选项 描述 Name 媒介名称,看着起名 Type 选择 Email SMTP server SMTP 服务器 SMTP helo SMTP helo 值, 通常情况下是顶级域名 SMT
阅读全文
摘要:一 Action概述 当产生Trigger后,即当触发器条件被满足时,采取一些操作,如发送事件通知,远程执行命令等,需要配置Action。 名称 作用 Trigger 当Trigger的状态从OK变为PROBLEM Discovery 当network discovery工作 Auto regist
阅读全文
摘要:一 告警简介 告警指将达到某一个阀值事件的消息发送给用户,让用户在事件发生的时候即可知道监控项处于不正常状态,从而采取相应的措施。在Zabbix中,高进是由一系列的流程组成,首先是触发器达到阀值,接下来是Action对事件信息进行处理,其中包括两部分:第一部分是发送消息,即将告警信息发送给用户;第二
阅读全文
摘要:一 维护时间 在某些正常业务维护期间,不需要进行告警,可添加维护时间。 二 维护时间添加 2.1 维护 参数 描述 Name 维护名称 Maintenance type 两种维护类型可选: With data collection - 依旧收集数据 No data collection - 暂停收集
阅读全文
摘要:一 宏介绍 Zabbix宏的作用是便于在模板、Items、Trigger中的引用,名称为{$名称},宏的字符范围为:A~Z/0~9/_。 如:net.tcp.service[ssh,{$SSH_PORT}] 其中{$SSH_PORT}为宏。 二 相关宏介绍及配置 2.1 全局宏 作用范围:模板、主机
阅读全文
摘要:一 Zabbix监控机汇总计算 用Calcuated Items可以对Items进行汇总计算,如求磁盘总容量、网络流量,只依赖于Zabbix-Server,与Zabbix-Agent和proxy无关。Calcuated Items也可用于Trigger,配置与Items相同。 语法格式为:func(
阅读全文