Grafana+Prometheus+node_exporter实现服务器监控
之前写的平台用oshi监控本机数据,被领导看见说这东西不错,你给我把所有电脑都监控起来。今天就把坑给填了
1. 每台需要监控的服务器都要安装采集器node_exporter。
linux推荐使用docker安装(有的grafana仪表盘需要指定采集器的版本)
docker pull prom/node-exporter:v1.0.1
windows系统安装windows_exporter,直接下载双击打卡即可。目前win7系统没法安装,猜测是软件版本问题
https://github.com/prometheus-community/windows_exporter/releases
2.安装完成之后打开
linux http://127.0.0.1:9100/metrics
windows http://127.0.0.1:9182/metrics
3.安装 prometheus,Prometheus 是由 SoundCloud 开源监控告警解决方案。这边是监控服务器,上面的是被监控的电脑
docker pull prom/prometheus
然后创建配置文件
mkdir /opt/prometheus cd /opt/prometheus/ vim prometheus.yml
设变假设监控服务器的ip地址是10.5.0.199global:
scrape_interval: 60s evaluation_interval: 60s #上面的默认就行 scrape_configs: - job_name: prometheus static_configs: - targets: ['localhost:9090']#这边输入需要采集器的ip地址和端口 labels: instance: prometheus#这个无所谓 - job_name: linux static_configs: - targets: ['10.5.0.11:9100','10.5.0.12:9100']#多个以逗号分开 labels: instance: localhost
#启动docker
docker run -d \ -p 9090:9090 \ -v /opt/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml \ prom/prometheusf
访问10.5.0.199:9090/targets 看一下节点状态
节点一开始没起来过一会就会起来的,如果一直不起来很大原因是刚才的配置文件有问题,导致docker没起来,注意检查配置文件的空格
4.安装grafana,grafana是数据可视化工具
docker pull grafana/grafana:7.2.0
新建grafana-storage文件夹来存储文件
mkdir /opt/grafana-storage
设置权限
chmod 777 -R /opt/grafana-storage
启动grafana
docker run -d \ -p 3000:3000 \ --name=grafana \ -v /opt/grafana-storage:/var/lib/grafana \ grafana/grafana
访问url:
http://10.5.0.199:3000/
默认密码是admin/admin
添加数据源:
添加仪表盘:因为监控的机器操作系统不同,采集的数据不同,所以不能通用
监控win10:https://grafana.com/grafana/dashboards/10467
监控linux:https://grafana.com/grafana/dashboards/8919
这样就完成了,因为是现成的仪表盘,需要先阅读说明文字,保证上面的采集器版本与说明文字中的相同。
监控自动报警等功能后续再更新吧