夜莺和prometheus监控/pull与push

prometheus告警流程分析

以 sum(rate(coredns_dns_requests_total[1m])) > 100 为例

模型	系统	阈值判断	是否支持多series告警	触发条件	组合条件	nodata
push	夜莺v4	由judge接收点触发判断，查询本地数据	不支持，每个策略针对单一series 对应judge中内存列表只能用预聚合解决	将happen、all、 any等和聚合 avg、 max、 min等揉在一起	需做pull	需做pull
pull	prometheus	由promql 查询存储	promql直接支持查询到一个就是一条，多个就是多条	prometheus触发条件只支持持续时间，其他的全部为聚合func	promql and支持	promql absent支持

相比于性能损耗，pull模型带来的灵活性是巨大的

push型的告警模式无疑会带来性能提升
因为pull模型需要每次查询存储，虽然是当前点，但也有些损耗
但
- 现代的tsdb 有倒排索引+布隆过滤器的加持，告警查询损耗可以降到很低
- pull模型带来的是非常灵活的触发表达式，从这点看，性能损耗可以忽略不计
- 现在告警触发时都需要带上一些聚合的方法，这点push模型做不到

posted @ 2022-10-05 22:50 请务必优秀阅读(1205) 评论(0) 收藏举报

刷新页面返回顶部