概述

触发器中的表达式使用很灵活,我们可以创建一个复杂的逻辑测试监控,触发器表达式形式如下:

{主机:key.函数(参数)}<表达式>常数,具体的例子,请接着往下走,很简单

Functions函数

触发器functions可以引用检索到的值,当前时间或者其他元素。触发器表达式支持的function完整列表: 

FUNCTION函数

 

Description

Parameters

Comments

abschange

 

最新值和先前值之间差的绝对值

支持的值类型:

float, int, str, text, log

示例:
(pre value;last value=abschange)
1;5=4
3;1=2
0;-2.5=2.5
字符串类型的返回:
0 – 值相同
1 – 值不同

avg(sec|#num,<time_shift>)

 

定义评估期内项目Item的平均值

sec #num- 以秒为单位的评估期或最新收集的num个值(以散列标记开头)
time_shift(可选) -评估点将时间移回(即向过去的时间移)秒数

 

支持的值类型:

float, int

示例:
⇒ avg(#5) →最近5个值得平均值
⇒ avg(1h) →1小时内的平均值
⇒ avg(1h,1d) → 此刻起,一天前1小时内的平均值
time_shift参数从Zabbix 1.8.2开始被支持.

当需要将当前平均值与time_shift秒前的平均值进行比较时,很有用。

band(sec|#num,mask,<time_shift>)

 

item值和掩码的“按位与”的值

sec(ignored) 或 #num- 最新的第N个值,而不是最近总的N个
mask(mandatory) - 64位无符号整数(0-18446744073709551615)
time_shift(optional) - see avg()

 

支持的值类型:

int

 

注意:这里的#num和其他多数函数中的#num意义不同(和last()中的#num相同)

虽然比较是按位进行的,但所有提供的值和返回的值必须是十进制的。例如,检查第三位是通过比较4(0100)来完成的,而不是100(1100100)

示例:
⇒ band(,12)=8 或 band(,12)=4 → 第3或第4个位被设定,但不是同时
⇒ band(,20)=16 →第3位没有被设定,第5位被设定
从Zabbix 2.2.0.开始支持

change

 

最近的一个数值与前一个数值的差值

支持的值类型:

float, int, str, text, log

示例:
(pre value;last value=change)
1;5=+4
3;1=-2
0;-2.5=-2.5

字符串类型的返回:
0 – 值相同
1 – 值不同

 

count(sec|#num,<pattern>,<operator>,<time_shift>)

 

定义的评估期内的数值的个数

sec #num -以秒为单位的评估期或最新收集的num个值(以散列标记开头)
pattern(optional) – 需要的pattern
operator(optional)
支持的操作符:
eq- 等于
ne- 不等于
gt- 大于
ge- 大于等于
lt- 小于
le- 小于等于
like- 如果包含pattern这匹配(大小写敏感)
band- 按位与

regexp- 大小写敏感的正则匹配pattern
iregexp-大小写不敏感的正则匹配pattern

注意:
eq(默认),ne,gt,ge,lt,le,band,regexp,iregexp支持整数items

eq(默认),ne,gt,ge,lt,le,band,regexp,iregexp支持浮点数items
like(默认),eq,ne,regexp,iregexp支持 string, text和 log类型的items

time_shift(optional) - see avg()

 

支持的值类型:

float, int, str, text, log

浮点数精确到0.000001

使用band作为第三个参数,

第二个pattern参数可以指定为两个数字,用'/'分隔:number_to_compare_with/mask

 

count()从值和掩码计算“按位与”并将结果与number_to_compare_with进行比较

如果按位与的结果等于number_to_compare_with, 该值被计算.
如果number_to_compare_withmask相等,仅mask被指定(没有'/').


With regexp or iregexp as third parameter the second pattern parameter can be an ordinary or global (starting with '@') regular expression. In case of global regular expressions case sensitivity is inherited from global regular expression settings. For the purpose of regexp matching, float values will always be represented with 4 decimal digits after '.'. Also note that for large numbers difference in decimal (stored in database) and binary (used by Zabbix server) representation may affect the 4th decimal digit. 

示例:
⇒ count(10m) →计算最近10分钟内值的个数

⇒ count(10m,"error",eq) → 计算最近10分钟内值等于'error'的值的个数
⇒ count(10m,12) →计算最近10分钟内值等于'12'的值的个数

⇒ count(10m,12,gt) →计算最近10分钟内值大于'12'的值的个数
⇒ count(#10,12,gt) →计算最近10个值中大于'12'的值的个数
⇒ count(10m,12,gt,1d) → number of values for preceding 10 minutes up to 24 hours ago that were over '12'
⇒ count(10m,6/7,band) → number of values for last 10 minutes having '110' (in binary) in the 3 least significant bits.
⇒ count(10m,,,1d) → number of values for preceding 10 minutes up to 24 hours ago

The #num parameter is supported since Zabbix 1.6.1.
The time_shift parameter and string operators are supported since Zabbix 1.8.2.
The band operator is supported since Zabbix 2.2.0.
The regexpiregexp operators are supported since Zabbix 3.2.0.

 

date

 

以 YYYYMMDD 格式显示的当前日期

 

支持的值类型: any

返回值示例: 20150731

 

dayofmonth

 

每个月的日期范围1到 31

 

支持的值类型: any
从Zabbix 1.8.5.开始支持

 

dayofweek

 

星期几,范围1 到 7 (Mon - 1, Sun - 7).

 

支持的值类型: any

 

delta (sec|#num,<time_shift>)

 

定义的评估期内的最大值和最小值之间的差异('max()'减去'min()')。

sec或 #num -评估周期(以秒为单位)或指定的最新收集的num个值(以哈希标记开头)

time_shift (optional) - see avg()

支持的值类型: float, int

The time_shift parameter is supported since Zabbix 1.8.2.

 

diff

 

检查最新值和上一个值是否不同

 

支持的值类型: float, int, str, text, log
Returns:
1 – 二者不同
0 – 二者相同

 

forecast (sec|#num,<time_shift>,time,<fit>,<mode>)

 

item的未来值,最大值,最小值,增量值或平均值

sec 或 #num -评估周期(以秒为单位)或指定的最新收集的num个值(以哈希标记开头)
time_shift (optional) - see avg()
time - 以秒为单位预测水平

fit (optional) - 用于拟合历史数据的函数
支持的 fits:
linear – 线性函数
polynomialN - N次多项式(1 <= N <= 6)
exponential - 指数函数
logarithmic - 对数函数
power – 幂函数
注意:
linear是默认使用的拟合函数

 polynomial1等同于 linear

mode (optional) – 按要求输出
支持的mode:
value - value (默认)
max – 最大值
min – 最小值
delta – 最大值-最小值
avg – 平均值

注意:
valueitem值估计为 +time时刻的值

max,min,delta和avg评估在此刻及再经time之间的值

支持的值类型: float, int

如果返回值大于 999999999999.9999 或小于-999999999999.9999, 返回值分别被修剪为 999999999999.9999 或 -999999999999.9999

仅在表达式中被错误使用(如错误的item类型、无效参数)时才变得不受支持,否则在出现错误时返回-1。

示例:
⇒ forecast(#10,,1h) →基于最后10个值预测一小时后的item值
⇒ forecast(1h,,30m) →根据最后一小时数据预测30分钟后的item值
⇒ forecast(1h,1d,12h) →基于一天前一小时的12小时后的item预测
⇒ forecast(1h,,10m,exponential) →基于最后一小时数据和指数函数预测10分钟后的item值
⇒ forecast(1h,,2h,polynomial3,max) →根据最后一小时数据和三次(三次)多项式,最大值item的预测可以在接下来的两个小时内达到
⇒ forecast(#​2,,​-20m) → 根据最后两个值评估20分钟前item的值(这可能比使用last()或prev()更精确,特别是如果item很少更新,比如每小时更新一次)


Zabbix 3.0.0开始支持该函数
Zabbix 3.0.6 和 3.2.2后负的时间值开始支持
See also additional information on predictive trigger functions.

 

fuzzytime (sec)

 

检查item时间戳值与Zabbix Server时间的差异

sec - seconds

支持的值类型: float, int

Returns:
0 -如果item时间戳值与Zabbix Server时间戳之间的差异超过T秒
1 - otherwise.

通常与system.localtime一起使用,以检查本地时间是否与Zabbix Server的本地时间同步。也可以与vfs.file.time [/path/file,modify] Key一起使用,以检查该文件是否长时间没有获得更新。

Example:
⇒ fuzzytime(60)=0 → 如果时间差异操作60秒,检测到problem

 

iregexp (pattern,<sec|#num>)

 

此函数是regexp()的不区分大小写的版本。

see regexp()

Supported value types: str, log, text

 

last (sec|#num,<time_shift>)

 

最近一个值

sec (ignored) 或 #num – 最近的第N个值
time_shift (optional) - see avg()

Supported value types: float, int, str, text, log
注意,#num在这里的工作方式与许多其他功能不同
For example:
last() 总是等同于last(#1)
last(#3) – 最近的第三个值 (而不是最新的3个值)

如果历史记录中的一秒内存在两个以上的值,则Zabbix不保证值的确切顺序
Zabbix 1.6.2开始支持#num 参数
Zabbix 1.8.2开始支持time_shift参数

 

logeventid (pattern)

 

检查上一个日志条目的事件ID是否与正则表达式匹配。

pattern -在Zabbix 3.4之前描述所需模式,Perl兼容正则表达式(PCRE)样式或POSIX扩展正则表达式的正则表达式。

支持的值类型: log
Returns:
0 – 不匹配
1 – 匹配
This function is supported since Zabbix 1.8.5.

 

logseverity

 

记录上次日志条目的日志严重性

 

Supported value types: log

Returns:
0 – 默认严重性
N -严重性(整数,对Windows事件日志有用:1 - Information, 2 - Warning, 4 - Error, 7 - Failure Audit, 8 - Success Audit, 9 - Critical, 10 - Verbose)
Zabbix从Windows事件日志的信息字段中获取日志严重性。

 

logsource (pattern)

 

检查上一个日志条目的日志源是否与参数匹配。

pattern - required string

Supported value types: log

Returns:
0 – 不匹配
1 – 匹配
通常用于Windows事件日志。例如,logsource(“VMware Server”)

 

max (sec|#num,<time_shift>)

 

定义的评估期内item的最大值。

sec 或 #num -评估周期(以秒为单位)或最新收集的num个值(以哈希标记开头)time_shift (optional) - see avg()

Supported value types: float, int
The time_shift parameter is supported since Zabbix 1.8.2.

 

min (sec|#num,<time_shift>)

 

定义的评估期内item的最小值。

sec 或 #num -评估周期(以秒为单位)或最新收集的num个值(以哈希标记开头)time_shift (optional) - see avg()

Supported value types: float, int
The time_shift parameter is supported since Zabbix 1.8.2.

 

nodata (sec)

 

检查没有收到数据

sec -评估期以秒为单位。周期不应小于30秒,因为定时器进程仅每30秒计算一次
nodata(0)被禁止使用

Supported value types: any
Returns:
1 – 定义时间期间未接收到数据
0 - otherwise
注意,如果在第一个参数的周期内,此函数将显示错误:

- 没有数据且Zabbix服务器已重新启动

- 没有数据且维护已完成

- 没有数据且项目已添加或重新启用
Errors are displayed in the Info column in trigger configuration.

 

now

 

自从(00:00:00 UTC, January 1, 1970)到现在的秒数

 

Supported value types: any

 

percentile (sec|#num,<time_shift>,percentage)

 

P-th percentile of a period

期间的第P个百分位数,其中P(百分比)由第三个参数指定。

sec 或 #num -评估周期(以秒为单位)或最新收集的num个值(以哈希标记开头)time_shift (optional) - see avg()
percentage - 0到100(含)之间的浮点数,小数点后最多4位数

Supported value types: float, int

This function is supported since Zabbix 3.0.0.

 

prev

 

前一个值

 

Supported value types: float, int, str, text, log
等同于last(#2)

 

regexp (pattern,<sec|#num>)

 

检查最新(最新)值是否与正则表达式匹配。

pattern -正则表达式,在Zabbix 3.4之前的Perl兼容正则表达式(PCRE)样式或POSIX扩展正则表达式

sec 或 #num (optional) -评估周期(以秒为单位)或最新收集的num个值(以哈希标记开头)。在这种情况下,可以处理多个值。

Supported value types: str, text, log

Returns:
1 –发现至少一个
0 - otherwise
如果处理了多个值,则如果存在至少一个匹配值,则返回“1”
大小写敏感

 

str (pattern,<sec|#num>)

 

查找最新(最新)值中的字符串。

pattern – 要查找的字符串的正则
sec 或 #num (optional) -评估周期(以秒为单位)或最新收集的num个值(以哈希标记开头)。在这种情况下,可以处理多个值

Supported value types: str, text, log

Returns:
1 –找到
0 - otherwise
如果处理了多个值,则如果存在至少一个匹配值,则返回“1”
大小写敏感

 

strlen (sec|#num,<time_shift>)

 

字符(不是字节)中最新(最近)值的长度。

sec (ignored) 或 #num – 最近第N个值

time_shift (optional) - see avg()

Supported value types: str, text, log
Take note that #num works differently here than with many other functions.
示例:
⇒ strlen()(is equal to strlen(#1)) →最新值的长度
⇒ strlen(#3) →最近的第三个值的长度
⇒ strlen(,1d) → 一天前最新值的长度
This function is supported since Zabbix 1.8.4.

 

sum (sec|#num,<time_shift>)

 

在定义的评估期内收集的值的总和

sec 或 #num -评估周期(以秒为单位)或最新收集的num个值(以哈希标记开头)time_shift (optional) - see avg()

Supported value types: float, int

The time_shift parameter is supported since Zabbix 1.8.2.

 

time

 

以HHMMSS 格式显示当前时间

 

Supported value types: any
Example of returned value: 123055

 

timeleft (sec|#num,<time_shift>,threshold,<fit>)

 

item达到指定阈值所需的时间(以秒为单位)。

sec或 #num -评估周期(以秒为单位)或指定的最新收集的num个值(以哈希标记开头)
time_shift (optional) - see avg()
threshold - value to reach
fit (optional) - see forecast()

支持的值类型: float, int
如果返回的值大于 999999999999.9999,将被修剪为999999999999.9999.
如果无法达到阈值,则返回999999999999.9999


仅在表达式中使用错误(错误的item类型,无效参数)时才变得不受支持,否则在出现错误时返回-1

Examples:
⇒ timeleft(#10,,0) →item基于最后10个值达到零的时间⇒ timeleft(1h,,100) →根据最后一小时数据,item值达到100之前的时间
⇒ timeleft(1h,1d,0) →基于一天前一小时的item值达到0的时间

⇒ timeleft(1h,,200,polynomial2) →根据最后一小时数据,item达到200的时间,并假设该item的行为类似于二次(二次)多项式
Zabbix 3.0.0.开始支持该函数
自Zabbix 3.0.6和3.2.2起支持threshold参数中的单位符号。
See also additional information on predictive trigger functions.

 

1)所有函数只返回数值。例如,不支持与字符串比较。

2)某些功能不能用于非数字参数!

3)字符串参数应该用双引号。否则,他们可能会被误解。

4)对于所有触发函数,sec和time_shift必须是一个带有可选时间单位后缀的整数,并且与item的数据类型完全无关。

 

函数和不受支持的Item

从Zabbix 3.2开始,可以为不支持的item计算nodata(),date(),dayofmonth(),dayofweek(),now()和time()函数。其他函数要求所引用的item处于受支持的状态。

 

注意:

bandlaststrlen3个函数的#num参数表示的最近第num个值,而不是最近num个值

 

Function参数

大多数数值functions可以使用秒来作为参数。你可以使用前缀“#”来表示它有不同的含义

FUNCTION CALL描述
sum(600) 600秒内的总和
sum(#5) 最新5个值的和

last函数使用不同的参数将会得到不同的值,#2表示倒数第二新的数据。例入从老到最新值为1,2,3,4,5,6,7,8,9,10,last(#2)得到的值为9,last(#9)得到的值为2。last函数必须包含参数。
AVG,count,last,min和max函数还支持额外的参数,以秒为单位的参数time_shift(时间偏移量)。例如avg(1h,1d),那么将会获取到昨天的1小时内的平均数据。

[warning]备注:触发器表达式需要使用history历史数据来计算,如果history不可用(time_shift时间偏移量参数无法使用),因此history记录一定要保留长久一点,至少要保留需要用的记录。[/warning]
触发器表达式可以使用单位符号来替代大数字,例如5m替代300,或者1d替代86400,1k替代1024字节等等。

操作符

优先级操作定义
1 /
2 *
3 -
4 +
5 < 小于. 用法如下:
A<B ⇔ (A<=B-0.000001)
6 > 大于. 用法如下:
A>B ⇔ (A>=B+0.000001)
7 # 不等于.用法如下:
A#B ⇔ (A<=B-0.000001) | (A>=B+0.000001)
8 = 等于. T用法如下:
A=B ⇔ (A>B-0.000001) & (A<B+0.000001)
9 & 逻辑与
10 | 逻辑或

 

 

 

触发器示例

示例一

触发器名称:Processor load is too high on www.zabbix.com

触发器说明:

www.zabbix.com:host名称

system.cpu.load[all,avg1]:item值,一分内cpu平均负载值

last(0):最新值

>5:最新值大于5

如上所示,www.zabbix.com这个主机的监控项,最新的CPU负载值如果大于5,那么表达式会返回true,这样一来触发器状态就改变为“problem”了。

示例二

触发器名称:www.zabbix.com is overloaded

当前cpu负载大于5或者最近10分内的cpu负载大于2,那么表达式将会返回true.

示例三

触发器名称:/etc/passwd has been changed

使用函数 diff():

/etc/passwd最新的checksum与上一次获取到的checksum不同,表达式将会返回true. 我们可以使用同样的方法监控系统重要的配置文件,例如/etc/passwd,/etc/inetd.conf等等。这些zabbix一般都会自带,没带的你自己加上吧。

示例四

触发器名称:Someone is downloading a large file from the Internet

使用函数 min:

当前主机网卡eth0最后5分钟内接收到的流量超过100KB那么触发器表达式将会返回true

示例五

触发器名称:Both nodes of clustered SMTP server are down

当smtp1.zabbix.com和smtp2.zabbix.com两台主机上的SMTP服务器都离线,表达式将会返回true.

示例六

触发器名称:Zabbix agent needs to be upgraded

使用函数str():

如果当前zabbix agent版本包含beta8(假设当前版本为1.0beta8),这个表达式会返回true.

示例七

触发器名称:Server is unreachable

如上表达式表示最近30分钟zabbix.zabbix.com这个主机超过5次不可到达。

示例八

触发器名称:No heartbeats within last 3 minutes

使用函数 nodata():

tick为Zabbix trapper类型,首先我们要定义一个类型为Zabbix trapper,key为tick的item。我们使用zabbix_sender定期发送数据给tick,如果在3分钟内还未收到zabbix_sender发送来的数据,那么表达式返回一个true,与此同时触发器的值变为“PROBLEM”。

示例九

触发器名称:CPU activity at night time

使用函数 time():

只有在凌晨0点到6点整,最近5分钟内cpu负载大于2,表达式返回true,触发器的状态变更为“problem”

示例十

触发器名称:Check if client local time is in sync with Zabbix server time

使用函数 fuzzytime():

主机MySQL_DB当前服务器时间如果与zabbix server之间的时间相差10秒以上,表达式返回true,触发器状态改变为“problem”

示例十一

触发器名称:Comparing average load today with average load of the same time yesterday (使用 time_shift 时间偏移量参数).

This expression will fire if the average load of the last hour tops the average load of the same hour yesterday more than two times.

Hysteresis(迟滞,滞后)

简单的说触发器状态转变为problem需要一个条件,从problem转变回来还需要一个条件才行。一般触发器只需要不满足触发器为problem条件即可恢复。明白了么?不明白就看例子吧。
有时候触发器需要使用不同的条件来表示不同的状态,举个官网很有趣的例子:机房温度正常稳定为15-20°,当温度超过20°,触发器值为problem,直到温度低于15°才会接触警报,异常会解除。别整这些没用的,我们看实例.

为了达到这个效果,我们需要使用如下触发器表达式:

示例1

触发器名称:Temperature in server room is too high

如上有两个小括号,前面一个表示触发异常的条件,后面一个表达式表示解除异常的条件。

注意:宏变量 {TRIGGER.VALUE}将会返回当前触发器的值

示例2

触发器名称:Free disk space is too low

Problem: 最近5分钟剩余磁盘空间小于10GB。(异常)

Recovery: 最近10分钟磁盘空间大于40GB。(恢复)

简单说便是一旦剩余空间小于10G就触发异常,然后接下来剩余空间必须大于40G才能解除这个异常,就算你剩余空间达到了39G(不在报警条件里)那也是没用的,有意思不!

 

结尾

posted on 2019-05-08 17:20  苦咖啡~~  阅读(2497)  评论(0编辑  收藏  举报