08 2020 档案
摘要:使用k8s的扩展调度器机制来实现当某个基础监控的服务Pod不Ready时,这个Pod所在的节点就不允许调度,例如Pod(daemonset形式部署)中的服务会检测节点的CNI网络插件如果没有正常工作,这个Pod的由于探针作用就会变成不Ready的,那么扩展调度器就会避免调度业务Pod到该节点。在实践
阅读全文
摘要:0、metric_relabel_configs一个常用的用途:drop不需要的数据,不保存在Prometheus 中。 1、统计计算节点已经分配的cpu/memory request占节点Allocatable的百分比(类似kubectl describe node) sum(kube_pod_c
阅读全文
摘要:背景 容器云出现大量业务接口访问失败告警,观察到批量业务Pod状态变成MatchNodeSelector状态,同时调度生成新的Pod,由于目前未完全推广使用Pod优雅退出方案,在旧pod中的容器被删除,新pod创建起来的过错中就必然会导致交易丢失了。这次事件中我们观察到的现象是: 0、监控发现三个M
阅读全文