prometheus + node-exporter + Grafana 监控Linux资源情况
背景
1.Oracle集群需要监控
2.下载
2.1 node_exporter-1.6.1.linux-amd64.tar.gz
2.2 prometheus-2.46.0.linux-amd64.tar.gz
3.采集数据
下载监控Linux的exporter(注意选择自己的操作系统,我的操作系统是 Linux centos7.9),下载链接:https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz 将node_export 包上传到需要被监控的Linux服务器上,任意的目录下,执行解压命令。 wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz #1.解压命令 tar -zxvf node_exporter-1.6.1.linux-amd64.tar.gz #2.使用复制命令复制到 node_exporter 文件夹 mv node_exporter-1.6.1.linux-amd64 node_exporter 进入解压后的文件夹中,执行启动脚本。 #1.进入 node_exporter 文件夹 cd node_exporter #2.执行启动脚本 nohup ./node_exporter & #3.查看nohup日志,tail -100 nohup.out,出现如下日志,代表启动成功 注意:极有可能发生如下,报错信息如下:显示 listen tcp :9100: bind: address already in use 9100端口被占用,那么如何杀掉9100端口的进程呢?
3.1 验证
4. 监控节点
#1.下载命令 wget https://github.com/prometheus/prometheus/releases/download/v2.46.0/prometheus-2.46.0.linux-amd64.tar.gz #2.将 Prometheus 上传到一台单独的Linux机器上,然后执行下面的解压命令 tar -zxvf prometheus-2.46.0.linux-amd64.tar.gz #3.移动修改文件名称 mv prometheus-2.46.0.linux-amd64 prometheus #4.进入解压后的文件夹中,修改配置文件,添加要监控的服务器信息 ip vim prometheus.yml #5.添加如下的命令,其目的是在scrape_configs 配置项下添加 Linux 监控的 job,其中 IP 修改为 node_exporter 机器的ip,端口号默认是9100的,自己修改的端口号写自己的端口号。(复制粘贴下面的配置信息) - job_name: "linux" # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: ["192.168.xx.7:9100"] #6.保存配置文件,启动prometheus nohup ./prometheus & // 检查nohup.out日志,如果有以下信息,启动成功 #7.在浏览器中访问部署的prometheus:http://ip:9090,点击菜单栏 Status -> Targets,看到页面中有如下node节点,代表 Prometheus 和 node_exporter 链接成功。 出现如下的结果就正常。
4.1 注意点
4.1.1 空格一定要对齐
4.1.2 可以配置多个采集点
4.1.3 当修改配置,需要1.ps -ef|grep pro 2.kill -9 {pid} 3.再重启 Prometheus
4.2 验证
访问 http://{IP}:9090/targets
5.Grafana
5.1 添加数据源 data source
5.2 添加模板 impor id=11074 ,更多搜索 Grafana dashboard 模板