随笔分类 - Prometheus
摘要:注意: 1.设置访问密码的方式 2.ngixn反向代理的配置 # 安装 Apache工具包 apt install apache2-utils htpasswd -bc /etc/nginx/.prom_htpasswd admin admin # nginx conf cat > /etc/ngi
阅读全文
摘要:注意: 1.如何按照插件 2.nignx中如何进行设置反向代理 # Centos7 yum localinstall -y https://dl.grafana.com/oss/release/grafana-6.4.4-1.x86_64.rpm # 安装拼图、Consul数据源插件 grafana
阅读全文
摘要:grafana对报警的支持真的很弱,而Prometheus提供的报警系统就强大很多 Prometheus将数据采集和报警分成了两个模块。报警规则配置在Prometheus Servers上,然后发送报警信息到AlertManger,然后我们的AlertManager就来管理这些报警信息,包括sile
阅读全文
摘要:1.添加告警途径 这里以slack为例 测试是否可用 在slack上收到告警通知了 安装插件 # grafana-cli plugins install grafana-image-renderer installing grafana-image-renderer @ 2.0.0 from: ht
阅读全文
摘要:这种按需的资源使用方式对于监控系统而言就意味着没有了一个固定的监控目标,所有的监控对象(基础设施、应用、服务)都在动态的变化。对于Prometheus这一类基于Pull模式的监控系统,显然也无法继续使用的static_configs的方式静态的定义监控目标。而对于Prometheus而言其解决方案就
阅读全文
摘要:其他说明参考host主机监控规则:https://www.cnblogs.com/sanduzxcvbnm/p/13589848.html 在prometheus主程序目录下的rules目录下新建docker.yml文件,添加上如下内容,然后重启prometheus。 groups: - name:
阅读全文
摘要:为了能够获取到Docker容器的运行状态,用户可以通过Docker的stats命令获取到当前主机上运行容器的统计信息,可以查看容器的CPU利用率、内存使用量、网络IO总量以及磁盘IO总量等信息。 除了使用命令以外,用户还可以通过Docker提供的HTTP API查看容器详细的监控统计信息。 CAdv
阅读全文
摘要:Slack作为一款即时通讯工具,协作沟通主要通过Channel(平台)来完成,用户可以在企业中根据用途添加多个Channel,并且通过Channel来集成各种第三方工具。 例如,我们可以为监控建立一个单独的Channel用于接收各种监控信息: 通过一个独立的Channle可以减少信息对用户工作的干扰
阅读全文
摘要:其他说明参考host主机监控规则:https://www.cnblogs.com/sanduzxcvbnm/p/13589848.html groups: - name: Redis monitoring rules: - alert: BlackboxProbeFailed expr: probe
阅读全文
摘要:prometheus监控redis需要用到redis_exporter。 redis_exporter 项目地址:https://github.com/oliver006/redis_exporter 1、安装部署 这里则部署在了Prometheus Server之上。 cd /usr/local/
阅读全文
摘要:1.先在 Prometheus 主程序目录下创建rules目录,然后在该目录下创建 host.yml文件,内容如下: 内容很多,可以根据实际情况进行调整。 规则参考网址:https://awesome-prometheus-alerts.grep.to/rules 参考网址的规则中,有些地方需要修改
阅读全文
摘要:1.先在 Prometheus 主程序目录下创建rules目录,然后在该目录下创建 prometheus-test.yml文件,内容如下: 内容很多,可以根据实际情况进行调整。 规则参考网址:https://awesome-prometheus-alerts.grep.to/rules 注意:注意目
阅读全文
摘要:https://awesome-prometheus-alerts.grep.to/
阅读全文
摘要:为了提升Promthues的服务可用性,通常用户会部署两个或者两个以上的Promthus Server,它们具有完全相同的配置包括Job配置,以及告警配置等。当某一个Prometheus Server发生故障后可以确保Promthues持续可用。 同时基于Alertmanager的告警分组机制即使不
阅读全文
摘要:Prometheus的本地存储给Prometheus带来了简单高效的使用体验,可以让Promthues在单节点的情况下满足大部分用户的监控需求。但是本地存储也同时限制了Prometheus的可扩展性,带来了数据持久化等一系列的问题。通过Prometheus的Remote Storage特性可以解决这
阅读全文
摘要:Prometheus内置了一个基于本地存储的时间序列数据库。在Prometheus设计上,使用本地存储可以降低Prometheus部署和管理的复杂度同时减少高可用(HA)带来的复杂性。 在默认情况下,用户只需要部署多套Prometheus,采集相同的Targets即可实现基本的HA。同时由于Prom
阅读全文
摘要:具体监控配置详看这篇文章:https://www.cnblogs.com/sanduzxcvbnm/p/13094580.html 为了确保数据库的稳定运行,通常会关注一下四个与性能和资源利用率相关的指标:查询吞吐量、连接情况、缓冲池使用情况以及查询执行性能等。 监控数据库吞吐量 对于数据库而言,最
阅读全文
摘要:CAdvisor是Google开源的一款用于展示和分析容器运行状态的可视化工具。通过在主机上运行CAdvisor用户可以轻松的获取到当前主机上容器的运行统计信息,并以图表的形式向用户展示。 在本地运行CAdvisor也非常简单,直接运行一下命令即可: docker run \ --volume=/:
阅读全文
摘要:Exporter是什么 广义上讲所有可以向Prometheus提供监控样本数据的程序都可以被称为一个Exporter。而Exporter的一个实例称为target,如下所示,Prometheus通过轮询的方式定期从这些target中获取样本数据: Exporter的来源 从Exporter的来源上来
阅读全文
摘要:通过PromQL可以实时对Prometheus中采集到的样本数据进行查询,聚合以及其它各种运算操作。而在某些PromQL较为复杂且计算量较大时,直接使用PromQL可能会导致Prometheus响应超时的情况。 这时需要一种能够类似于后台批处理的机制能够在后台完成这些复杂运算的计算,对于使用者而言只
阅读全文