随笔 - 121  文章 - 0  评论 - 2  阅读 - 68745 
09 2023 档案
scheduler,kube-controller-manager 报server returned HTTP status 401 Unauthorized
摘要:现象:K8S 组件报 server returned HTTP status 401 Unauthorized,看apiserver 日志有很多Unable to authenticate the request" err="[x509: certificate has expired or is 阅读全文
posted @ 2023-09-24 13:13 MhaiM 阅读(1405) 评论(0) 推荐(0) 编辑
K8S 使用GPU 节点资源问题配置
摘要:说明:2024/04/08 nvidia-container-runtime,现在叫 nvidia-container-toolkit gpu共享技术(提高资源利用率): 时间分片Time-Slicing多实例 GPU (MIG)多进程服务 (MPS) 启动服务 nvidia-cuda-mps-co 阅读全文
posted @ 2023-09-20 15:40 MhaiM 阅读(1217) 评论(0) 推荐(0) 编辑
k8s coredns服务报 Readiness probe failed 8181: connect: connection refused
摘要:现象:Readiness probe failed 8181: connect: connection refused 1、分析: kubectl 直接 describe CoreDNS Pod,显示 ReadinessProbe 探针异常,导致 Pod 无法正常启动,由于 ReadinessPro 阅读全文
posted @ 2023-09-19 15:20 MhaiM 阅读(1553) 评论(0) 推荐(0) 编辑
kubesphere 集群管理平台,prometheus数据修改问题
摘要:背景:kubesphere 修改完所有控制器资源会恢复回原来的配置,没法通过控制器去修改资源 1、登录ks-console 容器 kubectl exec -it ks-installer-7bb9b86d69-qlfvg -n kubesphere-system bash #kubesphere 阅读全文
posted @ 2023-09-11 10:04 MhaiM 阅读(227) 评论(0) 推荐(0) 编辑
prometheus远程永久存储方案VictoriaMetrics 部署单机版
摘要:1、单机版下载地址: https://github.com/VictoriaMetrics/VictoriaMetrics 注:集群版选择cluster版本 2、下载解压得到二进制文件 tar -xf victoria-metrics-linux-amd64-v1.93.1.tar.gz mv vi 阅读全文
posted @ 2023-09-01 15:36 MhaiM 阅读(650) 评论(2) 推荐(1) 编辑

点击右上角即可分享
微信分享提示