探索云原生 - 博客园

2025年12月19日

摘要： Buildah 是一个专注于构建 OCI 镜像的工具，Buildah CLI 工具使用底层 OCI 技术实现（例如 containers/image 和 containers/storage)。 OCI 三剑客包括：专注于镜像构建的 Buildah 专注于镜像和容器管理的 Podman 专注于镜像阅读全文

posted @ 2025-12-19 14:41 探索云原生阅读(919) 评论(0) 推荐(0)

2025年9月9日

HAMi vGPU 原理分析 Part4：Spread&Binpack 高级调度策略实现

摘要：上篇我们分析了 hami-scheduler 工作流程，知道了 hami-webhook、hami-scheduler 是怎么配合工作的。本文为 HAMi 原理分析的第四篇，分析 hami-scheduler 在调度时是如何选择节点的，即：Spread、Binpack 等高级调度策略是怎么实现的。阅读全文

posted @ 2025-09-09 12:23 探索云原生阅读(191) 评论(0) 推荐(0)

2025年7月31日

HAMi vGPU 原理分析 Part3：hami-scheduler 工作流程分析

摘要：上篇我们分析了 hami-webhook，该 Webhook 将申请了 vGPU 资源的 Pod 的调度器修改为 hami-scheduler，后续使用 hami-scheduler 进行调度。本文为 HAMi 原理分析的第三篇，分析 hami-scheduler 工作流程。上篇主要分析了 ha 阅读全文

posted @ 2025-07-31 09:25 探索云原生阅读(602) 评论(0) 推荐(0)

2025年7月24日

HAMi vGPU 原理分析 Part2：hami-webhook 原理分析

摘要：上篇我们分析了 hami-device-plugin-nvidia，知道了 HAMi 的 NVIDIA device plugin 工作原理。本文为 HAMi 原理分析的第二篇，分析 hami-scheduler 实现原理。为了实现基于 vGPU 的调度，HAMi 实现了自己的 Schedule 阅读全文

posted @ 2025-07-24 13:34 探索云原生阅读(628) 评论(0) 推荐(0)

2025年7月16日

K8s 自定义调度器 Part1：通过 Scheduler Extender 实现自定义调度逻辑

摘要：本文主要分享如何通过 Scheduler Extender 扩展调度器从而实现自定义调度策略。 1. 为什么需要自定义调度逻辑什么是所谓的调度? 所谓调度就是指给 Pod 对象的 spec.nodeName 赋值待调度对象则是所有 spec.nodeName 为空的 Pod 调度过程则是从集群现阅读全文

posted @ 2025-07-16 13:47 探索云原生阅读(744) 评论(0) 推荐(0)

2025年7月9日

开源 vGPU 方案 HAMi 原理分析 Part1：hami-device-plugin-nvidia 实现

摘要：本文为开源的 vGPU 方案 HAMi 实现原理分析第一篇，主要分析 hami-device-plugin-nvidia 实现原理。之前在开源 vGPU 方案：HAMi,实现细粒度 GPU 切分介绍了 HAMi 是什么，然后在开源 vGPU 方案 HAMi: core&memory 隔离测试阅读全文

posted @ 2025-07-09 09:32 探索云原生阅读(809) 评论(0) 推荐(0)

2025年7月4日

开源 vGPU 方案 HAMi: core&memory 隔离测试

摘要：本文主要对开源的 vGPU 方案 HAMi 的 GPU Core&Memory 隔离功能进行测试。省流： HAMi vGPU 方案提供的 Core&Memory 隔离基本符合预期： Core 隔离：Pod 能使用的算力会围绕设定值波动，但是一段时间内平均下来和申请的 gpucores 基本一致 M 阅读全文

posted @ 2025-07-04 09:14 探索云原生阅读(618) 评论(0) 推荐(0)

2025年6月18日

K8s v1.31 新特性：ImageVolume，允许将镜像作为 Volume 进行挂载

摘要：本文主要分享一个 K8s 1.31 增加的一个新 Feature：ImageVolume。允许直接将 OCI 镜像作为 Volume 进行挂载，加速 artifact 分发。 1.背景 Kubernetes 社区正在积极发展，以更好地支持未来的人工智能 (AI) 和机器学习 (ML) 场景。为满足阅读全文

posted @ 2025-06-18 13:16 探索云原生阅读(694) 评论(0) 推荐(0)

2025年6月6日

开源 vGPU 方案：HAMi,实现细粒度 GPU 切分

摘要：本文主要分享一个开源的 GPU 虚拟化方案：HAMi，包括如何安装、配置以及使用。相比于上一篇分享的 TimeSlicing 方案，HAMi 除了 GPU 共享之外还可以实现 GPU core、memory 得限制，保证共享同一 GPU 的各个 Pod 都能拿到足够的资源。 1.为什么需要 GPU 阅读全文

posted @ 2025-06-06 12:28 探索云原生阅读(1584) 评论(0) 推荐(1)

2025年5月13日

一文搞懂 GPU 共享方案： NVIDIA Time Slicing

摘要：本文主要分享 GPU 共享方案，包括如何安装、配置以及使用，最后通过分析源码了 TImeSlicing 的具体实现。通过配置 TImeSlicing 可以实现 Pod 共享一块物理 GPU，以提升资源利用率。 1.为什么需要 GPU 共享、切分等方案？开始之前我们先思考一个问题，为什么需要 GPU 阅读全文

posted @ 2025-05-13 12:15 探索云原生阅读(1007) 评论(0) 推荐(0)

KubeExplorer

公告