Zabbix高可用集群

介绍:

  高可用性模式为 Zabbix 服务器提供了针对软件/硬件故障的保护,并允许在软件/硬件维护期间最大限度地减少停机时间。

  高可用性 (HA) 集群是一种可选的解决方案,它支持 Zabbix 服务器。 原生 HA 解决方案被设计为使用简单,它可以跨站点工作,并且对 Zabbix 识别的数据库没有特定要求。 用户可以自由使用本机 Zabbix HA 解决方案或第三方 HA 解决方案,具体取决于最适合其环境中的高可用性要求的方案。

  该解决方案由多个 zabbix_server 实例或节点组成。 每个节点:

  单独配置(配置文件、脚本、加密、数据导出)

  使用相同的数据库

  有几种模式:active, standby, unavailable, stopped

  注:一次只能有一个节点处于活动状态(工作)。 备用节点不进行数据收集、处理或其他常规服务器活动; 他们不监听端口; 他们有最少的数据库连接。

  活动节点和备用节点每 5 秒更新一次它们的最后一次访问时间。 每个备用节点监控活动节点的最后访问时间。 如果活动节点的最后访问时间超过“故障转移延迟”秒,则备用节点将自己切换为活动节点并将“不可用”状态分配给先前的活动节点。

  活动节点监控自己的数据库连接——如果它丢失超过故障转移延迟 5 秒,它必须停止所有处理并切换到备用模式。 活动节点还监视备用节点的状态——如果备用节点的最后访问时间超过“故障转移延迟”秒,则为备用节点分配“不可用”状态。

  ha_status - 在 Zabbix 服务器日志中记录 HA 集群状态;

  ha_remove_node=target - 移除一个由其 <target> 标识的 HA 节点 - 列表中节点的编号(该编号可以从运行 ha_status 的输出中获得)。 请注意,不能移除主备节点。

  ha_set_failover_delay=delay - 设置 HA 故障转移延迟(支持时间后缀,例如 10s、1m)

 

posted @ 2022-02-16 10:10  摩天居士-谢烟客  阅读(829)  评论(0编辑  收藏  举报