上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 82 下一页
摘要: # 前言 kratos protos 生成 `pb.go` 文件时,会出现引用其他 proto 文件报错 `was not found or had errors`,因找不到此文件而无法编译。 # 解决 首先我们先了解下 protoc 中 import 的两条规则: 1. import 不允许使用相 阅读全文
posted @ 2023-05-02 23:02 牛奔 阅读(217) 评论(0) 推荐(0) 编辑
摘要: dcgm-exporter 采集指标项 https://help.aliyun.com/document_detail/433222.html#section-oin-6mf-6j0 | 指标 | 解释 | | | | dcgm_fan_speed_percent | GPU风扇转速占比(%) dc 阅读全文
posted @ 2023-05-02 18:11 牛奔 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 问题描述 pytorch 报错 No module named 'nn' 如果你 import torch 没问题,而 import torch.nn时出现问题,你可能命名使用了一个名字为 torch.py 文件,由于 torch.py 文件与系统的 torch.py 文件重名,所以会触发该问题,将 阅读全文
posted @ 2023-04-20 10:17 牛奔 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 检查​​kubelet​​服务状态 systemctl status kubelet 检查journal日志 ​​journalctl​​​ 的 ​​-u​​​ 参数可以指定服务进行过滤,这样可以屏蔽掉其他无关日志。 ​​--no-pager​​ 参数可以一次性输出日志 journalctl -u 阅读全文
posted @ 2023-03-25 17:52 牛奔 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 错误原因 kubernetes 的文件驱动与 docker 不一致,导致镜像无法启动。 docker info 可以看到驱动方式 Cgroup Driver: systemd。 解决方案 统一资源管理,一致使用 systemd 或者 cgroupfs。 在 Linux 上,控制组(CGroup)用于 阅读全文
posted @ 2023-03-25 17:27 牛奔 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 前言 服务器统一版本 Ubuntu 20.04 搭建集群最少要两台服务器 每台服务器都需要 docker、环境配置、安装 kubeadm、kubelet 和 kubectl docker 安装 docker sudo apt install -y docker.io # 安装Docker Engin 阅读全文
posted @ 2023-03-16 22:23 牛奔 阅读(1236) 评论(0) 推荐(0) 编辑
摘要: 前言 虚拟机开始时设置的磁盘空间比较小,后面使用就不够了。 # 查询磁盘使用情况 df -h 虚拟硬盘扩容 关闭正在运行的虚拟机 选中工具栏 选择虚拟硬盘,并选中需要扩容的磁盘 拖动进度条,设置想要扩容的大小 保存应用 扩容工具 启动虚拟机,打开桌面命令行,输入 gparted 启动硬盘扩容工具,如 阅读全文
posted @ 2023-03-13 22:16 牛奔 阅读(589) 评论(0) 推荐(0) 编辑
摘要: 前言 K8s 集群部署使用了 calico 网络插件,而calico node 节点发生如下报错: 2023-03-13 11:19:36.622 [FATAL][828] int_dataplane.go 1032: Kernel's RPF check is set to 'loose'. Th 阅读全文
posted @ 2023-03-13 19:35 牛奔 阅读(100) 评论(0) 推荐(0) 编辑
摘要: 什么是API对象 作为一个集群操作系统,Kubernetes 归纳总结了 Google 多年的经验,在理论层面抽象出了很多个概念,用来描述系统的管理运维工作,这些概念就叫做“API 对象”。 因为 apiserver 是 Kubernetes 系统的唯一入口,外部用户和内部组件都必须和它通信,而它采 阅读全文
posted @ 2023-03-05 22:14 牛奔 阅读(357) 评论(0) 推荐(0) 编辑
摘要: 云计算时代的操作系统 Kubernetes 是一个生产级别的容器编排平台和集群管理系统,能够创建、调度容器,监控、管理服务器。 Kubernetes 的基本架构 操作系统的一个重要功能就是抽象,从繁琐的底层事务中抽象出一些简洁的概念,然后基于这些概念去管理系统资源。 Kubernetes 也是这样, 阅读全文
posted @ 2023-03-05 09:45 牛奔 阅读(74) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 14 ··· 82 下一页