根据zabbix server的告警对其进行调优
1.前言
随着监控主机数量的增多,zabbix会提示各种zabbix server相关的告警,这时候就需要有的放矢地对zabbix server进行调优。
2.zabbix server相关告警的监控模板
如图1,内置模板"Template App Zabbix Server"的触发器内容。
3.zabbix server相关告警的解决方案
3.1"More than 75% used in the configuration cache"告警
按需调大zabbix server配置文件
中的CacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.2"More than 75% used in the history cache"告警
按需调大zabbix server配置文件中的HistoryCacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.3"More than 75% used in the history index cache"告警
按需调大zabbix server配置文件中的HistoryIndexCacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.4"More than 75% used in the trends cache"告警
按需调大zabbix server配置文件中的TrendCacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.5"More than 75% used in the vmware cache"告警
按需调大zabbix server配置文件中的VMwareCacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.6"More than 95% used in the value cache"告警
按需调大zabbix server配置文件中的ValueCacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.7"More than 100 items having missing data for more than 10 minutes"告警
- 先排除zabbix server/zabbix proxy是否能采集到多个监控项(具体看是zabbix server采集数据,还是zabbix proxy采集数据)。
- 若zabbix server能采集到数据,则按需调大zabbix server配置文件中的StartPollers参数,修改完成后重启zabbix server服务使配置文件生效。
- 若zabbix proxy能采集到数据,则排查zabbix server和zabbix proxy时间是否同步。
- 若zabbix server和zabbix proxy时间同步,则按需调大zabbix proxy配置文件中的StartPollers参数,修改完成后重启zabbix proxy服务使配置文件生效。
若无效果,则还需结合"zabbix_server.log"进行分析。
3.8"Utilization of alerter processes over 75%"告警
按需调大zabbix server配置文件中的StartAlerters参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.9"Utilization of alert manager processes over 75%"告警
按需调大zabbix server配置文件中的StartAlerters参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.10"Utilization of alert syncer processes over 75%"告警
按需调大zabbix server配置文件中的StartAlerters参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.11"Utilization of configuration syncer processes over 75%"告警
具体结合"zabbix_server.log"进行分析。
3.12"Utilization of discoverer processes over 75%"告警
- 关闭"配置"-"自动发现"中的"自动发现规则"。
- 按需调大zabbix server配置文件中的StartDiscoverers参数,修改完成后重启zabbix server服务使配置文件生效。
若无效果,则还需结合"zabbix_server.log"进行分析。
3.13"Utilization of escalator processes over 75%"告警
按需调大zabbix server配置文件中的StartEscalators参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.14"Utilization of history syncer processes over 75%"告警
可以调整监控项的历史数据的存储周期和保留期限,适当减少历史数据的存储量。若无效果,则还需结合"zabbix_server.log"进行分析。
3.15"Utilization of housekeeper processes over 75%"告警
- 按需调大zabbix server配置文件中的HousekeepingFrequency参数和MaxHousekeeperDelete参数,修改完成后重启zabbix server服务使配置文件生效。
- 最好的办法还是做数据库的表分区并关闭housekeeper功能。
2.16"Utilization of http poller processes over 75%"告警
按需调大zabbix server配置文件中的StartHTTPPollers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.17"Utilization of icmp pinger processes over 75%"告警
按需调大zabbix server配置文件中的StartPingers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.18"Utilization of ipmi manager processes over 75%"告警
按需调大zabbix server配置文件中的StartIPMIPollers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.19"Utilization of ipmi poller processes over 75%"告警
按需调大zabbix server配置文件中的StartIPMIPollers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.20"Utilization of java poller processes over 75%"告警
按需调大zabbix server配置文件中的StartJavaPollers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.21"Utilization of lld manager processes over 75%"告警
按需调大zabbix server配置文件中的StartLLDProcessors参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.22"Utilization of lld worker processes over 75%"告警
按需调大zabbix server配置文件中的StartLLDProcessors参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.23"Utilization of poller processes over 75%"告警
按需调大zabbix server配置文件中的StartPollers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.24"Utilization of preprocessing manager processes over 75%"告警
按需调大zabbix server配置文件中的StartPreprocessors参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.25"Utilization of preprocessing worker processes over 75%"告警
按需调大zabbix server配置文件中的StartPreprocessors参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.26"Utilization of proxy poller processes over 75%"告警
按需调大zabbix server配置文件中的StartProxyPollers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.27"Utilization of self-monitoring processes over 75%"告警
具体结合"zabbix_server.log"进行分析。
3.28"Utilization of snmp trapper processes over 75%"告警
按需调大zabbix server配置文件中的StartSNMPTrapper参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.29"Utilization of task manager processes over 75%"告警
具体结合"zabbix_server.log"进行分析。
3.30"Utilization of timer processes over 75%"告警
按需调大zabbix server配置文件中的StartTimers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.31"Utilization of trapper processes over 75%"告警
按需调大zabbix server配置文件中的StartTrappers参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.32"Utilization of unreachable poller processes over 75%"告警
按需调大zabbix server配置文件中的StartPollersUnreachable参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.33"Utilization of vmware collector processes over 75%"告警
按需调大zabbix server配置文件中的StartVMwareCollectors、VMwareCacheSize和VMwareTimeout参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
3.34"Zabbix value cache working in low memory mode"告警
按需调大zabbix server配置文件中的ValueCacheSize参数,修改完成后重启zabbix server服务使配置文件生效。若无效果,则还需结合"zabbix_server.log"进行分析。
文章摘自:https://zhuanlan.zhihu.com/p/703784137