摘要:
使用prometheus来避免Kubernetes CPU Limits造成的事故 译自:Using Prometheus to Avoid Disasters with Kubernetes CPU Limits 本文将介绍Kubernetes的resource limits是如何工作的、使用哪些 阅读全文
摘要:
Kubernetes的垂直和水平扩缩容的性能评估 译自:Performance evaluation of the autoscaling strategies vertical and horizontal using Kubernetes 可扩展的应用可能会采用水平或垂直扩缩容来动态调整云端资源 阅读全文
摘要:
通过硬件计数器,将性能提升3倍之旅 翻译自:Seeing through hardware counters: a journey to threefold performance increase 本文通过对CPU层面的代码挖掘,发现JVM存在的问题,并通过对JVM打补丁的方式解决了大实例下性能不 阅读全文
摘要:
预置条件 安装kafka、prometheus 使用JMX exporter暴露指标 下载jmx exporter以及配置文件。Jmx exporter中包含了kafka各个组件的指标,如server metrics、producer metrics、consumer metrics等,但这些指标并 阅读全文
摘要:
kubernetes Tcp流量可视化 使用k8spacket和grafana的node graph插件可以查看kubernetes pod的TCP相关信息,如connection、bytes、和duration。下面是接收和响应的字节数信息: 安装k8spacket helm repo add k 阅读全文
摘要:
使用 Containerlab + Kind 快速部署 Cilium BGP 环境一文中使用Containerlab和Cilium实现了模拟环境下的Cilium BGP网络。它使用Containerlab模拟外部BGP路由器,使用Cilium BGP的CiliumBGPPeeringPolicy与外 阅读全文
摘要:
## Grafana Mimir:支持乱序的指标采集 译自:[New in Grafana Mimir: Introducing out-of-order sample ingestion](https://grafana.com/blog/2022/09/07/new-in-grafana-mim 阅读全文
摘要:
事件的事后调查 译自:Anatomy of an Incident。看完整篇文章,最多的感触是一个好的SRE(或者其他角色)需要一个好的企业文化,很多时候压力并不能成为解决问题的动力,反而会成为问题解决的绊脚石,甚至成为员工换工作的动力。 简介 毫无疑问,接下来将是个人和职业上充满压力的N周,有时我 阅读全文
摘要:
通过重新构建Kubernetes来实现更具弹性的容器编排系统 译自:rearchitecting-kubernetes-for-the-edge 摘要 近年来,kubernetes已经发展为容器编排的首要选择。kubernetes主要面向云环境,但新的边缘场景要求性能、可用性和可扩展编排。kuber 阅读全文
摘要:
最近看了一篇文章:Tracking Down “Invisible” OOM Kills in Kubernetes,其讲述的是由于内存不足导致Pod中的进程被killed,但Pod并没有重启,也没有任何日志或kubernetes事件,只有一个"Exit Code: 137"的信息,导致难以进一步定 阅读全文