Prometheus介绍及二进制部署(一)
一、Prometheus是什么
Prometheus是什么
Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维护,Prometheus于2016年加入云原生云计算基金会(CNCF),成为继Kubernetes之后的第二个托管项目。
https://prometheus.io https://github.com/prometheus
作为新一代的监控框架,Prometheus 具有以下特点:
多维数据模型:由度量名称和键值对标识的时间序列数据
- PromSQL:一种灵活的查询语言,可以利用多维数据完成复杂的查询
- 不依赖分布式存储,单个服务器节点可直接工作
- 基于HTTP的pull方式采集时间序列数据
- 推送时间序列数据通过PushGateway组件支持
- 通过服务发现或静态配置发现目标
- 多种图形模式及仪表盘支持
Prometheus适用于以机器为中心的监控以及高度动态面向服务架构的监控。
二、Prometheus的组成及架构
2.1 Prometheus 由多个组件组成,但是其中许多组件是可选的:
- Prometheus Server:用于收集指标和存储时间序列数据,并提供查询接口
- client Library:客户端库(例如Go,Python,Java等),为需要监控的服务产生相应的/metrics并暴露给Prometheus Server。目前已经有很多的软件原生就支持Prometheus,提供/metrics,可以直接使用。对于像操作系统已经不提供/metrics,可以使用exporter,或者自己开发exporter来提供/metrics服务。
- push gateway:主要用于临时性的 jobs。由于这类 jobs 存在时间较短,可能在 Prometheus 来 pull 之前就消失了。对此Jobs定时将指标push到pushgateway,再由Prometheus Server从Pushgateway上pull。这种方式主要用于服务层面的 metrics
- exporter:用于暴露已有的第三方服务的 metrics 给 Prometheus。
- alertmanager:从 Prometheus server 端接收到 alerts 后,会进行去除重复数据,分组,并路由到对收的接受方式,发出报警。常见的接收方式有:电子邮件,pagerduty,OpsGenie, webhook 等。
- Web UI:Prometheus内置一个简单的Web控制台,可以查询指标,查看配置信息或者Service Discovery等,实际工作中,查看指标或者创建仪表盘通常使用Grafana,Prometheus作为Grafana的数据源;
2.2 数据模型
Prometheus将所有数据存储为时间序列;具有相同度量名称以及标签属于同一个指标。每个时间序列都由度量标准名称和一组键值对(也成为标签)唯一标识。
时间序列格式:
<metric name>{<label name>=<label value>, ...}
示例:api_http_requests_total{method="POST", handler="/messages"}
2.3 指标类型
Counter:递增的计数器
Gauge:可以任意变化的数值
Histogram:对一段时间范围内数据进行采样,并对所有数值求和与统计数量
Summary:与Histogram类似
2.4 任务和实例
就Prometheus而言,pull拉取采样点的端点服务称之为instance,通常对应一个过程(实例)。具有相同目的的instance,例如,为可伸缩性或可靠性而复制的流程称为作业,构成了一个job。
scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['192.168.5.237:9090'] - job_name: 'node' static_configs: - targets: ['192.168.5.10:9090']
三、部署Prometheus服务
2.1 最新二进制包下载地址:https://prometheus.io/download/
wget https://github.com/prometheus/prometheus/releases/download/v2.18.0-rc.1/prometheus-2.18.0-rc.1.linux-amd64.tar.gz tar xf prometheus-2.18.0-rc.1.linux-amd64.tar.gz -C /usr/local/ ln -s /usr/local/prometheus-2.18.0-rc.1.linux-amd64 /usr/local/prometheus
mkdir -P /usr/local/prometheus/data
2.2 使用systemd管理prometheus服务
# vim /usr/lib/systemd/system/prometheus.service [Unit] Description=https://prometheus.io [Service] Restart=on-failure ExecStart=/usr/local/prometheus/prometheus --config.file=/usr/local/prometheus/prometheus.yml --storage.tsdb.path=/usr/local/prometheus/data --web.enable-lifecycle [Install] WantedBy=multi-user.target
2.3 启动服务
# systemctl daemon-reload
# systemctl start prometheus.service
2.4 访问服务9090端口
http://192.168.5.55:9090/graph
2.5 默认的metrics接口地址
http://192.168.5.55:9090/metrics