zabbix删除dashboard无用的报警信息issue
zabbix出现性能问题,于是清理了一下数据表,在 zabbix_server 端出现性能问题的时候,有大量的插入数据库操作无法执行,触发了大规模服务器不可达的报警
经过搜索发现这些信息是跨表联合查询出来的,涉及: triggers 和 events 两个表
于是truncate events和problem两个表,发现悲剧了
last 20 issue 中有大量的报警条目无法删除掉,实际机器报警已经过去,机器现在是OK状态,这样显示在dashboard中严重影响报警的查看
触发条件: 在早前报警时候,在web管理页面内点过 acknowledged 标记,以后抓取triggers 条目是 就会每次将 这个标记机器的报警抓取出来了.
处理办法:
在events 表中 将acknowledged=1条目删除掉,在triggers中将对应的频繁报警条目相关内容删除掉.(因为有些表字段含义不清楚,所有将相关条目都删除了,操作之前最好备份操作的表,免得悲剧)
delete from events where acknowledged=1;
# 删除在issue中出现最多的条目
delete from triggers where description like '%is unreachable for 8 minutes%' ;
delete from triggers where description like '%Host information was changed on%' ;
删除后效果:
记录操作记录:
mysql> use zabbix;
Database changed
mysql> delete from events where acknowledged=1;
Query OK, 0 rows affected (0.20 sec)
mysql> delete from triggers where description like '%is unreachable for 8 minutes%';
Query OK, 2 rows affected (0.03 sec)
mysql> delete from triggers where description like '%is unreachable for 15 minutes%';
Query OK, 0 rows affected (0.01 sec)
mysql> delete from triggers where description like '%Queue data status issue%';
Query OK, 1 row affected (0.02 sec)
到此还没有结束,刚才删除的时候连带模板中的触发器一起删除了,需要我们重新在对应的模板中重新添加触发器,否则可能导致某些问题无法触发报警