摘要:
有天,接到用户请求, 帮助排查生产环境POD反复自动重启的原因,于是登录主机,执行"kubectl describe pod <pod name> -n <namespaces>"查看,发现POD是因为OOM被杀了,然后kubelet又自动重新拉起。 State: Running Started: 阅读全文
摘要:
应用运行在k8s平台上,有时候会发现POD自动重启造成业务影响,通过kubectl describe pod可以看到POD重启的原因,如果是OOM killed,则是因为应用使用内存超过了limit,被OOM killed了。 其实,应用被OOM killed应该分为两种情况: 1. POD OOM 阅读全文
摘要:
有一天,接到用户电话,请求帮忙排除一个问题。 用户的服务是部署在k8s集群上的,通过nodePort向集群外暴露服务,前端使用了nginx做负载均衡,nginx转发到集群中三台主机上的nodePort。 问题的现象是,nginx连后端nodePort偶尔会发生connection refused,因 阅读全文