随笔分类 - kubernetes
kubernetes,简称K8s,是用8代替名字中间的8个字符“ubernete”而成的缩写。是一个开源的,用于管理云平台中多个主机上的容器化的应用,Kubernetes的目标是让部署容器化的应用简单并且高效(powerful),Kubernetes提供了应用部署,规划,更新,维护的一种机制。
摘要:在 DCGM(Data Center GPU Manager)中,"Collect Switch Metrics" 和 "Collect Link Metrics" 是两个功能选项,用于收集关于 GPU 交换机和连接的指标数据。它们的含义如下: Collect Switch Metrics(收集交换
阅读全文
摘要:# 报错 ``` ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm). ``` # 问题原因 在 `PyTorch` 中使用 `Data
阅读全文
摘要:# 介绍 `.tpl` 是一种文件扩展名,通常是指模板文件(template file)。 模板文件是包含预定义格式和占位符变量的文本文件,用于生成其他文件或输出,如代码或配置文件。 一些常见的模板文件格式包括: * Jinja2:一种基于 Python 的模板语言,可以生成 HTML、XML、JS
阅读全文
摘要:# k8s Pod状态详解 在 Kubernetes 中,Pod 是最小的可部署的计算单元,它是一组容器的集合,共享同一个网络命名空间、存储卷等资源。 Kubernetes 中的 Pod 有以下几种状态: 1. **Pending(挂起)**:Pod 已经被 Kubernetes API 接受,但它
阅读全文
摘要:# 前言 使用 `k8s` 挂载卷文件时,使用了 `hostPath`,`type: File` ``` volumeMounts: - mountPath: /usr/share/grafana/public/img/grafana_icon.svg name: custom-logo subPa
阅读全文
摘要:dcgm-exporter 采集指标项 https://help.aliyun.com/document_detail/433222.html#section-oin-6mf-6j0 | 指标 | 解释 | | | | dcgm_fan_speed_percent | GPU风扇转速占比(%) dc
阅读全文
摘要:检查kubelet服务状态 systemctl status kubelet 检查journal日志 journalctl 的 -u 参数可以指定服务进行过滤,这样可以屏蔽掉其他无关日志。 --no-pager 参数可以一次性输出日志 journalctl -u
阅读全文
摘要:错误原因 kubernetes 的文件驱动与 docker 不一致,导致镜像无法启动。 docker info 可以看到驱动方式 Cgroup Driver: systemd。 解决方案 统一资源管理,一致使用 systemd 或者 cgroupfs。 在 Linux 上,控制组(CGroup)用于
阅读全文
摘要:前言 服务器统一版本 Ubuntu 20.04 搭建集群最少要两台服务器 每台服务器都需要 docker、环境配置、安装 kubeadm、kubelet 和 kubectl docker 安装 docker sudo apt install -y docker.io # 安装Docker Engin
阅读全文
摘要:前言 K8s 集群部署使用了 calico 网络插件,而calico node 节点发生如下报错: 2023-03-13 11:19:36.622 [FATAL][828] int_dataplane.go 1032: Kernel's RPF check is set to 'loose'. Th
阅读全文
摘要:什么是API对象 作为一个集群操作系统,Kubernetes 归纳总结了 Google 多年的经验,在理论层面抽象出了很多个概念,用来描述系统的管理运维工作,这些概念就叫做“API 对象”。 因为 apiserver 是 Kubernetes 系统的唯一入口,外部用户和内部组件都必须和它通信,而它采
阅读全文
摘要:云计算时代的操作系统 Kubernetes 是一个生产级别的容器编排平台和集群管理系统,能够创建、调度容器,监控、管理服务器。 Kubernetes 的基本架构 操作系统的一个重要功能就是抽象,从繁琐的底层事务中抽象出一些简洁的概念,然后基于这些概念去管理系统资源。 Kubernetes 也是这样,
阅读全文
摘要:前言 Kubernetes 一般都运行在大规模的计算集群上,管理很严格,Kubernetes 充分考虑到了这方面的需求,提供了一些快速搭建 Kubernetes 环境的工具。 minikube 它是一个“迷你”版本的 Kubernetes,自从 2016 年发布以来一直在积极地开发维护,紧跟 Kub
阅读全文
摘要:前言 本地的 8080 映射到 Pod 的 80,kubectl 会把这个端口的所有数据都转发给集群内部的 Pod kubectl port-forward wp-pod 8080:80 & 在命令的末尾使用了一个 & 符号,让端口转发工作在后台进行 发生报错: Unable to listen o
阅读全文