prometheus + node-exporter + Grafana 监控Linux资源情况

背景

1.Oracle集群需要监控

2.下载

2.1 node_exporter-1.6.1.linux-amd64.tar.gz

2.2 prometheus-2.46.0.linux-amd64.tar.gz

 

3.采集数据

下载监控Linux的exporter(注意选择自己的操作系统,我的操作系统是 Linux centos7.9),下载链接:https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz

将node_export 包上传到需要被监控的Linux服务器上,任意的目录下,执行解压命令。

wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gz
#1.解压命令
tar -zxvf node_exporter-1.6.1.linux-amd64.tar.gz
#2.使用复制命令复制到 node_exporter 文件夹
mv node_exporter-1.6.1.linux-amd64 node_exporter
进入解压后的文件夹中,执行启动脚本。

#1.进入 node_exporter 文件夹
cd node_exporter
#2.执行启动脚本
nohup ./node_exporter &
#3.查看nohup日志,tail -100 nohup.out,出现如下日志,代表启动成功
注意:极有可能发生如下,报错信息如下:显示 listen tcp :9100: bind: address already in use 9100端口被占用,那么如何杀掉9100端口的进程呢?

3.1 验证

访问 http://{IP}:9100/metrics

4. 监控节点

#1.下载命令
wget https://github.com/prometheus/prometheus/releases/download/v2.46.0/prometheus-2.46.0.linux-amd64.tar.gz

#2.将 Prometheus 上传到一台单独的Linux机器上,然后执行下面的解压命令
tar -zxvf prometheus-2.46.0.linux-amd64.tar.gz

#3.移动修改文件名称
mv prometheus-2.46.0.linux-amd64 prometheus

#4.进入解压后的文件夹中,修改配置文件,添加要监控的服务器信息 ip
vim prometheus.yml
#5.添加如下的命令,其目的是在scrape_configs 配置项下添加 Linux 监控的 job,其中 IP 修改为 node_exporter 机器的ip,端口号默认是9100的,自己修改的端口号写自己的端口号。(复制粘贴下面的配置信息)

 - job_name: "linux"

    # metrics_path defaults to '/metrics'
    # scheme defaults to 'http'.

    static_configs:
      - targets: ["192.168.xx.7:9100"]

#6.保存配置文件,启动prometheus
 nohup ./prometheus &
// 检查nohup.out日志,如果有以下信息,启动成功
#7.在浏览器中访问部署的prometheus:http://ip:9090,点击菜单栏 Status -> Targets,看到页面中有如下node节点,代表 Prometheus 和 node_exporter 链接成功。 出现如下的结果就正常。

  4.1 注意点

    4.1.1 空格一定要对齐

    4.1.2 可以配置多个采集点

    4.1.3 当修改配置,需要1.ps -ef|grep pro 2.kill -9 {pid} 3.再重启 Prometheus

  4.2 验证

访问 http://{IP}:9090/targets

 

5.Grafana

5.1 添加数据源 data source

5.2 添加模板  impor id=11074 ,更多搜索 Grafana dashboard 模板

 

posted @ 2023-11-16 16:29  AlamZ  阅读(100)  评论(0编辑  收藏  举报