摘要:
查看ns状态 root@test-10-5-2-15:~# kubectl get ns NAME STATUS AGE cert-manager Terminating 19h 查看该命名空间下的资源 kubectl api-resources -o name --verbs=list --nam 阅读全文
摘要:
# cat clear_k8s_ingress.sh set -e kubectl get ing -A -o=custom-columns='NAMESPACE:.metadata.namespace,NAME:.metadata.name,SVCs:..service.name' --no-he 阅读全文
摘要:
问题现象 在某个集群节点上的服务访问service服务:端口,会出现偶发timeout的问题,集群有的节点不会出现访问timeout的问题 问题处理 查看bridge-nf-call-iptables参数是否开启 cat /proc/sys/net/bridge/bridge-nf-call-ipt 阅读全文
摘要:
k8s gpu 共享方案 1.配置环境变量实现 通过在POD的启动文件中,配置NVIDIA_VISIBLE_DEVICES的环境变量,指定显卡号。NVIDIA_VISIBLE_DEVICES可配置为具体的显卡号,也可以配置all env: - name: NVIDIA_VISIBLE_DEVICES 阅读全文
摘要:
查看证书的有效期 [root@host ~]# openssl x509 -in ca.pem -noout -dates notBefore=Oct 12 07:56:37 2023 GMT notAfter=Oct 9 07:56:37 2033 GMT 打印证书的内容 [root@host ~ 阅读全文
摘要:
1.生成CA证书 # 生成 RSA 私有秘钥 openssl genrsa -out ca-key.pem 4096 # 生成CSR(Certificate Signing Request),CSR和KEY是匹配的,CSR是最终的证书和私钥配对使用 openssl req -x509 -new -n 阅读全文
摘要:
简单说明 我们启pod服务时,有时需要在服务启动前做一些初始化的工作,这里可能会涉及多个shell命令以及判断执行,这里可以参考下面的步骤进行: command: ["/bin/bash"] args: - "-c" - | set -ex if [ ! -d "/opt/test" ];then 阅读全文
摘要:
# 1. 查看机器上的镜像列表 crictl images ls # 2.删除机器上没用使用的镜像 crictl rmi --prune 阅读全文
摘要:
# 什么是序列化 我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化,在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。 # 为什么要序列化 ## 1. 持久保存状态 需知一个软件/程序的执 阅读全文
摘要:
# 简单说明 在实际的应用场景中,我们如果看到某个进程资源或服务异常,需要根据这个进程排查到底是哪个服务的Pod,这里我们介绍一种根据PID快速寻找Pod名称的方法。 # 实际操作 ## 查看进程PID 这里我们以GPU任务为例说明,可以看到占用显卡的任务PID为8241 ``` [root@cen 阅读全文