告警的选型

(1)备选方案

  • Prometheus

  • Open-falcon

  • Zabbix

 

(2)方案对比

我们从市面上调研了一些监控系统,其中比较流行的是Prometheus、Open-falcon、Zabbix。根据自身需求对这三个监控系统进行对比,首先我们进行对接方面的对比。这三个系统它们都可以支持多通道的告警源,同时可以支持多通道的告警目标,所以在这个需求上面,这三个方案都是满足的。

关于告警的收敛。Zabbix 在告警的收敛上面没有任何的支持。Open-falcon只进行了一些简单的收敛,比如一段时间内重复的告警,它不会重复的发送。而Prometheus提供了灵活的规则,能够满足在不同场景下的需求。但是通知次数上面,Open-falcon和Zabbix都限制了最大通知次数,Prometheus则没有最大通知次数的限制,在这一点上上面两个方案比Prometheus好一点。

第三个需求方面的支持。首先是Zabbix,监控系统和告警系统绑定在一起,所以它的故障域很大。Open-falcon和Prometheus,其监控系统和告警系统都可以单独的部署,所以它的故障域相对来说要小,但是Open-falcon所有的组件都支持高可用,除了它的告警系统以外,这一点是比较遗憾的。

 

然后我们还考量了一些其他的方面:

 

第一点是配置,Open-falcon和Zabbix都是基于模板的配置,而Prometheus提供的是一种树形的配置,我们通过对比发现树形配置比较灵活,而且学习成本也相对较低。

 

第二点是语言,我们公司的大多数产品都是使用GO语言,所以我们希望选择的方案能够贴合我们的技术栈。通过以上方面的比较,我们最终选择了Prometheus作为我们的方案选型。Prometheus它是一整套的解决方案,它包括了监控系统Prometheus,以及告警的展示Grafana,以及它的告警系统Alertmanager。

 

 

 

参考原文地址:https://blog.csdn.net/weixin_34361881/article/details/93116829