随笔分类 - Kubernetes
摘要:参考链接:https://199604.com/2992 官网链接:https://docs.rke2.io/zh/
阅读全文
摘要:简单说明 有些情况下,我们可以进入集群查看某些secret的配置,这里如果想修改secret的配置时,没有secrets的源文件,可以采取如下的方案。 例如我们需要修改alertmanager.yaml的配置: 查看导出配置 $ kubectl get secrets -n monitoring a
阅读全文
摘要:简单说明 k8s的Event事件是一种资源对象,用于展示集群内发生的情况,k8s系统中的各个组件会将运行时发生的各种事件上报给apiserver 。 可以通过kubectl get event 或 kubectl describe pod podName 命令显示事件,查看k8s集群中发生了哪些事件
阅读全文
摘要:获取所有节点的污点信息 kubectl get nodes -o='custom-columns=NodeName:.metadata.name,TaintKey:.spec.taints[*].key,TaintValue:.spec.taints[*].value,TaintEffect:.sp
阅读全文
摘要:方案一: 通过Docker配置文件创建secret # 配置.docker/config.json文件,包含了与 Docker Hub 或其他私有仓库进行身份验证所需的凭据信息。 [root@mac-25 ~]# cat ~/.docker/config.json { "auths": { "reg
阅读全文
摘要:查看ns状态 root@test-10-5-2-15:~# kubectl get ns NAME STATUS AGE cert-manager Terminating 19h 查看该命名空间下的资源 kubectl api-resources -o name --verbs=list --nam
阅读全文
摘要:# cat clear_k8s_ingress.sh set -e kubectl get ing -A -o=custom-columns='NAMESPACE:.metadata.namespace,NAME:.metadata.name,SVCs:..service.name' --no-he
阅读全文
摘要:问题现象 在某个集群节点上的服务访问service服务:端口,会出现偶发timeout的问题,集群有的节点不会出现访问timeout的问题 问题处理 查看bridge-nf-call-iptables参数是否开启 cat /proc/sys/net/bridge/bridge-nf-call-ipt
阅读全文
摘要:k8s gpu 共享方案 1.配置环境变量实现 通过在POD的启动文件中,配置NVIDIA_VISIBLE_DEVICES的环境变量,指定显卡号。NVIDIA_VISIBLE_DEVICES可配置为具体的显卡号,也可以配置all env: - name: NVIDIA_VISIBLE_DEVICES
阅读全文
摘要:1.生成CA证书 # 生成 RSA 私有秘钥 openssl genrsa -out ca-key.pem 4096 # 生成CSR(Certificate Signing Request),CSR和KEY是匹配的,CSR是最终的证书和私钥配对使用 openssl req -x509 -new -n
阅读全文
摘要:简单说明 我们启pod服务时,有时需要在服务启动前做一些初始化的工作,这里可能会涉及多个shell命令以及判断执行,这里可以参考下面的步骤进行: command: ["/bin/bash"] args: - "-c" - | set -ex if [ ! -d "/opt/test" ];then
阅读全文
摘要:# 1. 查看机器上的镜像列表 crictl images ls # 2.删除机器上没用使用的镜像 crictl rmi --prune
阅读全文
摘要:# 简单说明 在实际的应用场景中,我们如果看到某个进程资源或服务异常,需要根据这个进程排查到底是哪个服务的Pod,这里我们介绍一种根据PID快速寻找Pod名称的方法。 # 实际操作 ## 查看进程PID 这里我们以GPU任务为例说明,可以看到占用显卡的任务PID为8241 ``` [root@cen
阅读全文
摘要:一.说明 kube-apiserver是k8s最重要的制组件之一,主要提供以下功能: 提供集群管理的REST API 接口, 包括认证授权、数据校验以及集群状态变更等 k8s 中所有模块与 etcd 的数据交互都需要走 API Server ,禁止直接和 etcd 通信 k8s API 的每个请求都
阅读全文
摘要:k8s的Pod无法分配IP 报错信息 E0222 07:22:36.762074 83 remote_runtime.go:113] RunPodSandbox from runtime service failed: rpc error: code = Unknown desc = failed
阅读全文
摘要:说明 下面是整理的日常常用的一些helm操作,后面会持续更新 下载chart到本地 helm repo add bitnami https://charts.bitnami.com/bitnami # 查看charts版本信息 helm search repo bitnami/kube-promet
阅读全文
摘要:插件链接:https://kubernetes.io/zh-cn/docs/tasks/extend-kubectl/kubectl-plugins/
阅读全文
摘要:说明 我们在调试helmfile编排的chart时,对于helm chart正常的情况下,我们编排的helmfile渲染模版的值出了问题,可能会存在以下的报错: helmfile template ERROR: exit status 1 EXIT STATUS 1 STDERR: Error: f
阅读全文
摘要:说明 使用helmfile时,我们首先得了解helm的使用,以及如何开发一个helm chart。 helm是kubernetes的包管理工具。在实际的使用场景中我们涉及同时部署多个chart、区分不同的部署环境、版本控制等需求。基于此需求,可以使用helmfile工具。 helmfile通过hel
阅读全文
摘要:一.简单说明 我们在启动Pod的时候,发现有很多pause容器运行。每次启动一个Pod,都会运行一个pause容器。那么这个pause容器究竟是干啥的,它到底有什么作用呢? Pause容器又叫Infra容器,我们在启动kubelet的服务时,指定了下面的配置参数: --pod-infra-conta
阅读全文