zabbix删除dashboard无用的报警信息issue



zabbix出现性能问题,于是清理了一下数据表,在 zabbix_server 端出现性能问题的时候,有大量的插入数据库操作无法执行,触发了大规模服务器不可达的报警
经过搜索发现这些信息是跨表联合查询出来的,涉及: triggers 和 events 两个表
于是truncate events和problem两个表,发现悲剧了

last 20 issue 中有大量的报警条目无法删除掉,实际机器报警已经过去,机器现在是OK状态,这样显示在dashboard中严重影响报警的查看


触发条件: 在早前报警时候,在web管理页面内点过 acknowledged 标记,以后抓取triggers 条目是 就会每次将 这个标记机器的报警抓取出来了.

处理办法:

在events 表中 将acknowledged=1条目删除掉,在triggers中将对应的频繁报警条目相关内容删除掉.(因为有些表字段含义不清楚,所有将相关条目都删除了,操作之前最好备份操作的表,免得悲剧)

delete from events where acknowledged=1;

# 删除在issue中出现最多的条目
delete from triggers where description like '%is unreachable for 8 minutes%' ;

delete from triggers where description like '%Host information was changed on%' ;

删除后效果:



记录操作记录:

mysql> use zabbix;
Database changed
mysql> delete from events where acknowledged=1;
Query OK, 0 rows affected (0.20 sec)

mysql> delete from triggers where description like '%is unreachable for 8 minutes%';
Query OK, 2 rows affected (0.03 sec)

mysql> delete from triggers where description like '%is unreachable for 15 minutes%';
Query OK, 0 rows affected (0.01 sec)

mysql> delete from triggers where description like '%Queue data status issue%';
Query OK, 1 row affected (0.02 sec)

到此还没有结束,刚才删除的时候连带模板中的触发器一起删除了,需要我们重新在对应的模板中重新添加触发器,否则可能导致某些问题无法触发报警

posted @ 2019-11-14 10:36  reblue520  阅读(1276)  评论(0编辑  收藏  举报