Prometheus部署+Grafana可视化+Alertmanager邮件告警并重启服务
1.Linux系统常见web服务自启动2.Windows Server常见web服务自启动
3.Prometheus部署+Grafana可视化+Alertmanager邮件告警并重启服务
4.Zabbix部署+邮件通知选型
我们单位自己开发的软件平台,需要自己来运维,正所谓不监控无运维,等着甲方来通知你服务挂了是一件很尴尬的事情。
在软件选型方面,监控工具简直是太多了,每个软件都有自己的领地,有的是偏向跟踪分析、有的是报警的、有的是日志收集、有的只监控硬件。
Prometheus、Nagios、Datadog、skywalking、zabbix、elk、SigNoz、Zipkin、Grafana、New Relic、Cacti、Munin……
因为单位将上线K8s,所以打算使用Prometheus。我们网管用zabbix,这个也挺好,功能丰富,拿来即用。
需求
我的需求如下:
1. 监控arcserver地图服务是否挂掉
2. 如果挂掉了,就重启服务,并通知我重启啦
Prometheus部署
Prometheus通过提供不同的exporter组件监控不同的目标。监测HTTP服务健康需要采用
blackbox_exporter组件。
Prometheus各种组件都是单独运行的,这种原子化的灵活组合更符合云原生的理念。
首先我们配置 prometheus.yml
global: scrape_interval: 1s scrape_configs: job_name: iarc-ping metrics_path: /arc params: module: [iarc] static_configs: targets: "192.168.200.175" relabel_configs: source_labels: [__address__] target_label: __param_target source_labels: [__param_target] target_label: instance target_label: __address__ replacement: 127.0.0.1:9115
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· DeepSeek 开源周回顾「GitHub 热点速览」
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了