会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
代码小工
Follow @gaorong
新随笔
联系
订阅
管理
2022年11月30日
kubernetes client-go pitfall
摘要: 作为云原生开发人员难免会给 kubernetes client-go 打交道,但是有许多坑总是一遍又一遍的被开发者踩到,下面梳理常见的坑,希望大家注意避免: informer cache中的数据是只读的, 任何修改都先deepcopy informer cache中的数据是只读的, 任何修改都应该先
阅读全文
posted @ 2022-11-30 17:19 gaorong404
阅读(750)
评论(1)
推荐(0)
2020年6月6日
KMS 加密kubernetes secrets的正确姿势
摘要: 背景 在kubernetes中, secrets默认是明文存储在etcd中,具有很大的安全风险,可以配置KMS provider进行加密。但引入KMS provider是否会对apiserver造成影响,需要从性能和可用方面进行仔细考量。 架构 目前kubernetes调用kms进行加解密,我们需要
阅读全文
posted @ 2020-06-06 19:30 gaorong404
阅读(2021)
评论(0)
推荐(0)
2020年5月24日
LoadBalancer在kubernetes架构下的实践
摘要: Backgound === 借助于kubernetes优秀的弹性扩缩功能,运行其中的应用程序能够在流量突增的时候坦然应对,在流量低谷的时候无需担心成本。但于此同时,也带来了极大的挑战: 弹性扩缩导致容器IP动态变化,客户端无法直接依赖于容器IP进行访问,我们必须通过某种方式固定流量入口,将流量通过该
阅读全文
posted @ 2020-05-24 15:04 gaorong404
阅读(5578)
评论(0)
推荐(2)
2020年2月23日
记一次kubernetes驱逐踩坑
摘要: 最近在公司的线上服务器上发现了一个现象: 将某个node的kubelet短暂的停掉之后,其上的pod马上会被驱逐,这让笔者大吃一惊,印象之中,停掉kubelet后,该node会变为 状态,随后controller manger会经过一段时间才开始驱逐其上的pod。还有个参数专门来控制这个时间: po
阅读全文
posted @ 2020-02-23 15:30 gaorong404
阅读(4434)
评论(6)
推荐(1)
2020年2月15日
kubernetes中node心跳处理逻辑分析
摘要: 最近在查看一个kubernetes集群中node not ready的奇怪现象,顺便阅读了一下kubernetes kube controller manager中管理node健康状态的组件 。我们知道kubernetes是典型的master slave架构,master node负责整个集群元数据
阅读全文
posted @ 2020-02-15 19:32 gaorong404
阅读(3563)
评论(1)
推荐(1)
2019年12月8日
kubectl exec 在kubelet中的处理流程
摘要: 基于kuebrnetes v1.17 简单来说,一个完整的streaming请求如下: 客户端 kubectl exec i t ... kube apiserver 向 Kubelet 发送流式请求 /exec/ Kubelet 通过 CRI 接口向 CRI Shim 请求 Exec 的 URL
阅读全文
posted @ 2019-12-08 12:07 gaorong404
阅读(4356)
评论(0)
推荐(0)
2019年10月27日
kubernetes kubelet组件中cgroup的层层"戒备"
摘要: cgroup是linux内核中用于实现资源使用限制和统计的模块,docker的风靡一时少不了cgroup等特性的支持。kubernetes作为容器编排引擎,除了借助docker进行容器进程的资源管理外,还提供了一些更加高级的资源管理功能,以提高资源利用率和更加稳定的程序运行环境,其中必然少不了cgr
阅读全文
posted @ 2019-10-27 12:01 gaorong404
阅读(6213)
评论(1)
推荐(1)
2019年10月21日
生产环境中的kubernetes 优先级与抢占
摘要: kubernetes 中的抢占功能是调度器比较重要的feature,但是真正使用起来还是比较危险,否则很容易把低优先级的pod给无辜kill。为了提高GPU集群的资源利用率,决定勇于尝试一番该featrue。当然使用之前还是得阅读一下相关的代码做到心里有数,出了问题也方便定位修复。 基本原理 优先级
阅读全文
posted @ 2019-10-21 22:48 gaorong404
阅读(1774)
评论(0)
推荐(0)
2019年10月20日
阿里terway源码分析
摘要: 背景 随着公司业务的发展,底层容器环境也需要在各个区域部署,实现多云架构, 使用各个云厂商提供的CNI插件是k8s多云环境下网络架构的一种高效的解法。我们在阿里云的方案中,便用到了阿里云提供的CNI插件terway。terway所提供的VPC互通的网络方案,方便对接已有的基础设施,同时没有overl
阅读全文
posted @ 2019-10-20 21:59 gaorong404
阅读(6627)
评论(1)
推荐(9)
2019年8月13日
golang timeoutHandler解析及kubernetes中的变种
摘要: Golang里的http request timeout比较简单,但是稍不留心就容易出现错误,最近在kubernetes生产环境中出现了的一个问题让我有机会好好捋一捋golang中关于timeout中的所有相关的东西。 Basic golang中timeout有关的设置, 资料已经比较多, 其中必须
阅读全文
posted @ 2019-08-13 11:46 gaorong404
阅读(2300)
评论(0)
推荐(2)
下一页