zabbix“专家坐诊”第254期问答
问题一
Q:老师,我重启zabbix-server服务,恢复正常了,然后过了一两分钟再刷新,有报这个错了。我看zabbix-server日志里没什么有用的信息。
A:selinux 关闭一下
Q:是关闭状态
A:看看server 自监控有没有 报错提示,看看有没有什么指标是超过触发器的
Q:没有报错,看起来内存用的有点高
A:图显示不出来,看看有没有产生告警?队列有堆积吗?机器性能是怎么样的?
Q:系统没有告警。16g内存 500g硬盘。队列怎么看
A: 有没有这台server的自监控,不是对系统监控的。用来监控zabbix的自监控
Q:这个没有
A:你要挂个模板,好像是zabbix server health;自监控
Q:好的明白,我找一下去。是这个吧老师加上之后有报错
A:ValueCacheSize 这个往上调
Q:好的,我试试
A: 建议加台proxy来过度。proxy也有自监控,zabbix本身的问题多数都能从自监控看出来
Q:告警消失了。部分加载有点慢。可以了,感谢老师
问题二
Q:老师,我的版本是Zabbix 5.0.30 前段时间用的一直很流畅没有问题,又加了十台机器后,图形趋势数据加载很慢很慢,也做了一些优化,配置文件里参数修改,数据库和server服务器分离等,想知道具体原因是什么,到达性能极限了吗?该怎么优化
A:看看server 的自监控对象有没有报错 可以通过图形化界面看看有哪些是高的
Q:Zabbix escalator processes more than 75% busy 我有300多台虚拟机,我当前的StartEscalators=4 ,应该设置多少合适,老师。
A:慢慢往上调,然后看看这个监控项有没有降下来 调到降下来为止、
问题三
Q:如何给zabbix报警消息增加声音提醒
A:默认就有声音的吧