随笔 - 121
文章 - 0
评论 - 2
阅读 -
68745
09 2023 档案
scheduler,kube-controller-manager 报server returned HTTP status 401 Unauthorized
摘要:现象:K8S 组件报 server returned HTTP status 401 Unauthorized,看apiserver 日志有很多Unable to authenticate the request" err="[x509: certificate has expired or is
阅读全文
K8S 使用GPU 节点资源问题配置
摘要:说明:2024/04/08 nvidia-container-runtime,现在叫 nvidia-container-toolkit gpu共享技术(提高资源利用率): 时间分片Time-Slicing多实例 GPU (MIG)多进程服务 (MPS) 启动服务 nvidia-cuda-mps-co
阅读全文
k8s coredns服务报 Readiness probe failed 8181: connect: connection refused
摘要:现象:Readiness probe failed 8181: connect: connection refused 1、分析: kubectl 直接 describe CoreDNS Pod,显示 ReadinessProbe 探针异常,导致 Pod 无法正常启动,由于 ReadinessPro
阅读全文
kubesphere 集群管理平台,prometheus数据修改问题
摘要:背景:kubesphere 修改完所有控制器资源会恢复回原来的配置,没法通过控制器去修改资源 1、登录ks-console 容器 kubectl exec -it ks-installer-7bb9b86d69-qlfvg -n kubesphere-system bash #kubesphere
阅读全文
prometheus远程永久存储方案VictoriaMetrics 部署单机版
摘要:1、单机版下载地址: https://github.com/VictoriaMetrics/VictoriaMetrics 注:集群版选择cluster版本 2、下载解压得到二进制文件 tar -xf victoria-metrics-linux-amd64-v1.93.1.tar.gz mv vi
阅读全文