SRE-基于阿里云的告警体系建设
基于数据源来做分类
sls日志告警
配置以及查看方式
sls日志左侧点击铃铛进入告警中心配置
告警规则触发就是sls日志的查询语句,配置的规则时间内,查询语句查询的数量达到配置值,就会触发告警
现状
5XX告警
应用error日志告警
云产品监控告警
配置以及查看方式
阿里云直接搜索云监控
左边云产品监控,然后搜索要配置的云产品即可,比如redis,rds,kafka
进去搜索到对应的实例,点击报警规则进去配置
现状
redis命中率,cpu等监控
mysql内存等监控
kafka堆积等监控
arms监控告警
配置以及查看方式
arms-应用监控-应用监控告警规则
现状
pod的fullgc,内存,以及应用的接口环比,慢接口等指标
xxl-job告警
配置以及查看方式
xxl-job管理台配置任务时选择告警组即可