摘要:一、监控有metrics接口的业务应用:以etcd为例 ### 监控etcd ~~~ 查看etcd的端口:2379 [root@k8s-master01 etcd]# netstat -lntp | grep etcd tcp 0 0 192.168.1.11:2379 0.0.0.0:* LIST
阅读全文
摘要:一、告警处理:ControllerManager告警解决方案 ### 告警处理方案:配置以下2点,即可解决 ~~~ 第一点:把监听地址更改为0.0.0.0 ~~~ 第二点:把servicemonitor对应的service给创建上 二、打开ControllerManager的监听地址为0.0.0.0
阅读全文
摘要:NO: Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of
阅读全文
摘要:一、Prometheus下ControllerManager告警处理 ### Prometheus告警参数说明: ~~~ Watchdog:查看监控是否是正常的;这个监控不想收可以关掉,也可以设置为按天发送状态报告 ~~~ CPUThrottlingHigh:CPU截流过高:可能这个CPU的Linu
阅读全文
摘要:NO: Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of
阅读全文
摘要:一、排序 ### 函数: ~~~ sort:正序 ~~~ sort_desc:倒序 二、正序: ### 函数:sort ~~~ 表达式:sort(node_memory_MemFree_bytes) ~~~ 输出结果:输出结果为顺序排序 三、倒序: ### 函数:sort_desc ~~~ 表达式:
阅读全文
摘要:一、对label进行处理 ### 2个label合并,赋值成一个新的label ~~~ # 函数:label_join ~~~ 表达式:label_join(node_filesystem_files_free, "new_label","","instance","mountpoint"):把in
阅读全文
摘要:一、去除小数点 ### 函数: ~~~ Ceil():四舍五入,向上取最接近的整数;比如2.79,向上取就是3 ~~~ floor():四舍五入:向下取最接近的整数,比如2.79,向下取就是2 二、去除小数点,向上取四舍五入 ### 函数:Ceil() ~~~ 表达式:ceil(predict_li
阅读全文
摘要:一、差值: ### 函数 ~~~ 函数:Delta:差值 二、查看和8h之前的差值是多少 ### 函数:delta ~~~ 表达式:delta(node_memory_MemFree_bytes[8h]) ~~~ 输出结果:和8小时之前的差值 Walter Savage Landor:strove
阅读全文
摘要:一、absent:判断监控指标是否正确 ### 查找k8s-master01内存监控值 ~~~ 表达式:node_memory_MemFree_bytes{instance="k8s-master01"} ~~~ 输出结果:254648320 二、absent返回值是什么: ### 函数:absen
阅读全文
摘要:一、predict_linear:预测性告警:查询预测性告警: ### 表达式: ~~~ node_filesystem_files_free:宿主机上一些分区的剩余空间 二、查找根节点的分区空间 ### 表达式: ~~~ node_filesystem_files_free{mountpoint=
阅读全文
摘要:一、Prometheus常用函数实例:查询kubelet_http_requests_total 二、查询表达式访问量:查询kubelet的访问量: ### 函数:无 ~~~ 表达式:kubelet_http_requests_total{endpoint="https-metrics",insta
阅读全文
摘要:一、Prometheus查询增长率:查询增长率:方法一:查询kubelet近1小时访问增长率 ### 函数:increase() ~~~ 表达式:increase(kubelet_http_requests_total{endpoint="https-metrics",instance="192.1
阅读全文
摘要:一、运算符: ### 集合运算: ~~~ 集合运算:and ,or,unless ### OR:查找小于等于2977,并且等于2977.7890625:or: ~~~ 并列关系,前面符合后面也需要符合 ~~~ node_memory_MemTotal_bytes/1024/1024 <= 2977
阅读全文
摘要:一、聚合:查看当前主机下有多少个节点和其使用的内存 二、sum:求和:sum(node_memory_MemTotal_bytes)/ 1024^2 计算3个节点的总内存数量 三、min:最小值:min:(node_memory_MemTotal_bytes) 查找当前所有资源下内存最小值 四、ma
阅读全文
摘要:一、过滤查询:过滤:Labelsets ### 查询语法: ~~~ offset:查看多少分钟之前的数据 offset 30m ~~~ Labelsets:过滤 ~~~ 过滤出具有 handler=“/login”的label的数据 二、绝对查询:查询http_request_total有多少个:查
阅读全文
摘要:一、匹配符: ### 匹配符:数学运算 ~~~ # 数学运算 ~~~ 数学运算:+-*/% ^ 二、查询node_memory_MemTotal_bytes值为内存总大小的字节:一般我们查看的是内存的GB或者兆 三、除以转换内存的值为兆node_memory_MemTotal_bytes/1024/
阅读全文
摘要:一、PromQL基本操作 ### 通过Prometheus通过自带的WEB-UI来查询 ~~~ # 查询方式一: 瞬时向量:包含该时间序列中最新的样本值 ~~~ # 查询方式二: 区间向量:带时间戳的:一段时间范围内的数据 ### 操作符优先级: ~~~ ^ ~~~ * / % ~~~ + - ~~
阅读全文
摘要:NO: Walter Savage Landor:strove with none,for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of
阅读全文
摘要:一、Prometheus概述:PrometheusMetrics架构图 二、PrometheusMetrics架构说明 ### PrometheusMetrics架构说明 ~~~ 主要核心是Prometheus server:prometheus-k8s-0 ~~~ 直接使用node节点存储的,查询
阅读全文