prometheus之面试题
1、全局配置
global标签下的配置,会作用到所有的抓取目标。有4种配置
-
scrape_interval:拉取 targets的默认时间间隔。
-
scrape_timeout:拉取一个 target 的超时时间。
-
evaluation_interval:评估rules的时间间隔。
-
external_labels:和外部系统交流时,添加到数据中的标签。
global: scrape_interval: 15s scrape_timeout: 10s evaluation_interval: 15s
2、规则文件配置
rule_files标签下的配置,它指定了一系列的rules 文件。
rule_files: - "rules/simple.rules" - "rules/rules/*.rules"
3、抓取配置
scrape_configs节点下的配置。主要用来配置拉取的数据。、
scrape_configs: - job_name: node metrics_path: /metrics scheme: http static_configs: - targets: - 10.1.204.109:9100 labels: instance: service1 - targets: - 10.1.205.235:9100 labels: instance: private - job_name: consul-knowledge metrics_path: /actuator/prometheus scheme: http consul_sd_configs: - server: 10.1.204.79:8500 tag_separator: ',' scheme: http allow_stale: true refresh_interval: 30s services: - knowledge-service - gateway-service
4、告警配置
alerting节点下的配置,用来指定Alertmanager相关的配置。
# Alerting specifies settings related to the Alertmanager. alerting: alert_relabel_configs: [ - <relabel_config> ... ] alertmanagers: [ - <alertmanager_config> ... ]
5、服务发现配置
1、prometheus服务发现:
- job_name: kubernetes-nodes
kubernetes_sd_configs:
- role: node