prometheus + node-exporter + Grafana 监控Linux资源情况
背景
1.Oracle集群需要监控
2.下载
2.1 node_exporter-1.6.1.linux-amd64.tar.gz
2.2 prometheus-2.46.0.linux-amd64.tar.gz
3.采集数据
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 | 下载监控Linux的exporter(注意选择自己的操作系统,我的操作系统是 Linux centos7.9),下载链接:https: //github .com /prometheus/node_exporter/releases/download/v1 .6.1 /node_exporter-1 .6.1.linux-amd64. tar .gz 将node_export 包上传到需要被监控的Linux服务器上,任意的目录下,执行解压命令。 wget https: //github .com /prometheus/node_exporter/releases/download/v1 .6.1 /node_exporter-1 .6.1.linux-amd64. tar .gz #1.解压命令 tar -zxvf node_exporter-1.6.1.linux-amd64. tar .gz #2.使用复制命令复制到 node_exporter 文件夹 mv node_exporter-1.6.1.linux-amd64 node_exporter 进入解压后的文件夹中,执行启动脚本。 #1.进入 node_exporter 文件夹 cd node_exporter #2.执行启动脚本 nohup . /node_exporter & #3.查看nohup日志,tail -100 nohup.out,出现如下日志,代表启动成功 注意:极有可能发生如下,报错信息如下:显示 listen tcp :9100: bind: address already in use 9100端口被占用,那么如何杀掉9100端口的进程呢? |
3.1 验证
4. 监控节点
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 | #1.下载命令 wget https: //github .com /prometheus/prometheus/releases/download/v2 .46.0 /prometheus-2 .46.0.linux-amd64. tar .gz #2.将 Prometheus 上传到一台单独的Linux机器上,然后执行下面的解压命令 tar -zxvf prometheus-2.46.0.linux-amd64. tar .gz #3.移动修改文件名称 mv prometheus-2.46.0.linux-amd64 prometheus #4.进入解压后的文件夹中,修改配置文件,添加要监控的服务器信息 ip vim prometheus.yml #5.添加如下的命令,其目的是在scrape_configs 配置项下添加 Linux 监控的 job,其中 IP 修改为 node_exporter 机器的ip,端口号默认是9100的,自己修改的端口号写自己的端口号。(复制粘贴下面的配置信息) - job_name: "linux" # metrics_path defaults to '/metrics' # scheme defaults to 'http'. static_configs: - targets: [ "192.168.xx.7:9100" ] #6.保存配置文件,启动prometheus nohup . /prometheus & // 检查 nohup .out日志,如果有以下信息,启动成功 #7.在浏览器中访问部署的prometheus:http://ip:9090,点击菜单栏 Status -> Targets,看到页面中有如下node节点,代表 Prometheus 和 node_exporter 链接成功。 出现如下的结果就正常。 |
4.1 注意点
4.1.1 空格一定要对齐
4.1.2 可以配置多个采集点
4.1.3 当修改配置,需要1.ps -ef|grep pro 2.kill -9 {pid} 3.再重启 Prometheus
4.2 验证
访问 http://{IP}:9090/targets
5.Grafana
5.1 添加数据源 data source
5.2 添加模板 impor id=11074 ,更多搜索 Grafana dashboard 模板
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
2022-11-16 jmeter 阶梯并发