Zabbix日常监控(触发器表达式、远程执行命令、宏简等)简单记录
主机的工作基本流程
Host group --> Host --> Application --> Item --> Trigger(OK-->PROBLEM,trigger event) --> Action( Conditon+Operation(send Message,Rend Command))
注释:主机组、主机、模板、监控项、触发器(OK或失败,产生事件)、动作(通知动作)
一、触发器表达式
触发器之间的依赖关系
例如一个主机DOWN就会出现很多报警,该主机的所有触发器都应依赖于agent检测触发器(不至于出现告警风暴)
1、格式及说明
item key:
命名要求:只能使用字母、数字、下划线、点号、连接符
Trigger:
触发器表达式:
{<server>:<key>.<function>(<parameter>)}<operator><constant>
示例:{www.kuaiyun.cn:system.cpu.load[all,avg1].last(0)}>3
注释: server 主机名称(也可以是模板名); key 主机上关系的相应监控项的key值; function 评估采集到的数据是否在合理范围内时所使用的函数,其 评估过程可以根据采取的数据、当前时间及其他因素进行: 目前,触发器所支持的函数有 avg 平均值 count 数据统计 change 返回最后的一个值和倒数第二个值对比 date 时间 dayofweek 本周的第几天 delta 指定时间范围内和数值内的 diff 文件是否有改变 iregexp 忽略字符大小写,正则表达式 regexp 检查最后一次采样的数据是否能够被制定的模式所匹配, 1表示匹配,0表示不匹配 主要用来监控日志内容的关键字 last 最近几次采样 max 最近采样最大值 min nodata (对于采集不到数据)没有数据判断异常 now 返回自unix元年只此刻经历的秒数 prev:倒数第二个采样值; str 从最后一个采样中,查找此次指定的字符,1找到0没找到 sum parameter 函数参数:大多数数值函数可以接受秒数为其参数, 而如果在数值参数之前使用”#“做为前缀,则表示为最近几次的取值, 如sum(300)表示300秒内所有取值之和,而sum(#10)则表示最近 10次取值之和; 此外,avg、count、last、min和max 还支持使用第二个参数, 用于完成时间限定;例如:max(1h,7d)将返回一周之前的最大值;
注释:参考官方文档:https://www.zabbix.com/documentation/3.0/manual/config/triggers
2、示例
1、Less than 5% free in the value cache
{Template App Zabbix Server:zabbix[vcache,buffer,pfree].min(10m)}<5
说明:
Template App Zabbix Server:主机名或模板名(模板套用到主机上)
zabbix:key
vcache buffer pfree key值
min 函数
10m 函数范围
< 条件
5 预设值
注释:十分钟内采集到的最小值如果小于5则进入PROBLEM状态;
2、{www.kuaiyun.cn:system.cpu.load[all,avg1].last(0)}>3
说明:
www.kuaiyun.cn 主机名或模板名(模板套用到主机上)
system.cpu.load key值
all 所有的
avg1 过去一分钟内
avg5 过去五分钟内
last 函数“last()”获取最近一次获取的值
“>5”表示来自主机www.kuaiyun.cn的最后一次获取的负载值大于5时触发器就会进入PROBLEM状态。
二、远程执行命令
远程命令是个非常危险的操作,对于zabbix用户的授权要根据具体情况给予相应的权限,本次仅为测试使用
1、概述
remote command 远程执行命令:
1、给zabbix定义sudo规则: zabbix ALL=(ALL) ALL (根据现实需求自己定义) 2、不支持active模式的agent (主动模式,zabbix默认为被动模式) 3、不支持代理模式; 4、命令长度不得超过255个字符 5、可以使用宏; 6、10050的端口允许进入 7、zabbix-server近执行命令,而不关心命令是否执行成功;
2、修改agent配置文件
/etc/zabbix/zabbix_agentd.conf EnableRemoteCommands=1 开启远程执行命令权限 LogRemteCommands=1 记录执行日志 Defaults requiretty #这项默认是开启的,我们要注释掉 解释:任何一个执行sudo命令时必须使用htty执行
3、例如远程执行重启httpd服务
执行命令本身:
如果用到以root用户执行命令,必须使用sudo命令
sudo /etc/rc.d/init.d/httpd restart
三、宏
宏:
一个已经定义好的变量
两类:
内建:{MACRO_NAME}
自定义:{$MACRO_NAME}
可使用的级别
优先级:host Template global (主机 模板 全局)
找到后直接使用,不再想后续查找
模板:
一系列配置的集合,此配置可通过“链接”的方式应用于指定的主机
User Parmeters:
zabbix内置可许多的item key;
实现用户自定义item key,实现特有数据指标监控;
只能在agent实现key的定义
语法:
UserParameter=<key>,<command>
不允许没有被监控的主机上线
python3