左扬 - 博客园

2026年6月22日

Kubernetes 编程 / Operator 专题【左扬精讲】—— 定义 Application 资源 + 添加自定义新 API 完整指南

摘要： K8s 编程 / Operator 专题【左扬精讲】—— 定义 Application 资源 + 添加自定义新 API 完整指南 Operator 是 Kubernetes 的扩展机制，它让开发者能够用自定义资源（CR）和自定义控制器来管理复杂的应用状态。但很多开发者在入门 Operator 开发时阅读全文

posted @ 2026-06-22 18:13 左扬阅读(3) 评论(0) 推荐(0)

2026年6月21日

Kubernetes 源码【左扬精讲】—— kube-scheduler（调度专题 · 九）：内部架构与核心组件

摘要： Kubernetes 源码【左扬精讲】—— kube-scheduler（调度专题 · 八）：内部架构与核心组件本篇是 kube-scheduler 调度专题的开篇。kube-scheduler 是 Kubernetes 控制平面的"大脑"——它负责将未调度的 Pod 分配到最合适的节点上。这个看阅读全文

posted @ 2026-06-21 16:54 左扬阅读(6) 评论(0) 推荐(0)

Kubernetes 源码【左扬精讲】—— kube-scheduler（调度专题 · 八）： —— 从入口到调度的全链路源码剖析（k8s v1.36.1）

摘要： Kubernetes 源码【左扬精讲】—— kube-scheduler（调度专题 · 八）： —— 从入口到调度的全链路源码剖析（k8s v1.36.1） Pod 是 k8s 最基本的调度单位。当用户提交一个 Pod（或 Deployment、StatefulSet 等工作负载）时，kube-sc 阅读全文

posted @ 2026-06-21 16:22 左扬阅读(5) 评论(0) 推荐(0)

2026年6月20日

DeepSeek-R1 多模态 R1 / VLM-GRPO【左扬精讲】—— Qwen2-VL 微调与视觉推理强化学习实战

摘要： DeepSeek-R1 多模态 R1 / VLM-GRPO【左扬精讲】—— Qwen2-VL 微调与视觉推理强化学习实战前面 6 篇 R1 系列博文覆盖了纯文本的 R1 训练 / 数据 / 评估 / 部署 / 端侧 / 推理时扩展。但 2025 年 LLM 最大的趋势是多模态——模型不仅能"读"文阅读全文

posted @ 2026-06-20 18:32 左扬阅读(16) 评论(0) 推荐(0)

DeepSeek-R1 工业 RAG + 微调混合系统【左扬精讲】—— R1 系列收官之作：从 Prompt → RAG → 微调选型决策树

摘要： DeepSeek-R1 工业 RAG + 微调混合系统【左扬精讲】—— R1 系列收官之作：从 Prompt → RAG → 微调选型决策树 R1 系列 7 篇博文讲完了训练 / 蒸馏 / 评估 / 部署 / 端侧 / 推理 / 多模态的完整链路。但工程团队最常问："我有一个新业务，到底该用 Pr 阅读全文

posted @ 2026-06-20 18:32 左扬阅读(15) 评论(0) 推荐(0)

DeepSeek-R1 推理时扩展【左扬精讲】—— o1 / R1 慢思考机制：Self-Consistency + ToT + PRM 详解

摘要： DeepSeek-R1 推理时扩展【左扬精讲】—— o1 / R1 慢思考机制：Self-Consistency + ToT + PRM 详解前面 5 篇 R1 系列博文覆盖了训练（GRPO + DAPO + PRIME）、数据（800K 蒸馏）、评估、部署（vLLM+K8s）、端侧。但 R1 最阅读全文

posted @ 2026-06-20 18:30 左扬阅读(8) 评论(0) 推荐(0)

DeepSeek-R1 端侧 LLM 工程【左扬精讲】—— llama.cpp 调参与 Apple Silicon / 国产 NPU / Android 端侧落地全攻略

摘要： DeepSeek-R1 端侧 LLM 工程【左扬精讲】—— llama.cpp 调参与 Apple Silicon / 国产 NPU / Android 端侧落地全攻略前面 4 篇博文覆盖了 R1 训练（GRPO）、数据（800K 蒸馏）、评估（LLM-as-Judge）、部署（vLLM+K8s）阅读全文

posted @ 2026-06-20 18:29 左扬阅读(33) 评论(0) 推荐(0)

DeepSeek-R1 vLLM + k8s 生产部署【左扬精讲】—— 从单卡 7B 到 100 卡 671B MoE 集群的工业化部署实战

摘要： DeepSeek-R1 vLLM + k8s 生产部署【左扬精讲】—— 从单卡 7B 到 100 卡 671B MoE 集群的工业化部署实战前面 4 篇 R1 系列博文覆盖了训练（GRPO 4 小时实验）、数据（800K CoT 蒸馏工厂）、评估（三层评估体系）。但有一个终极问题始终没讲：训练好、阅读全文

posted @ 2026-06-20 18:27 左扬阅读(17) 评论(0) 推荐(0)

DeepSeek-R1 评估与系统（Evaluation & Systems）【左扬精讲】—— 从 GSM8K/MMLU 到 LLM-as-Judge 的工业级评估方法论

摘要： DeepSeek-R1 评估与系统（Evaluation & Systems）【左扬精讲】—— 从 GSM8K/MMLU 到 LLM-as-Judge 的工业级评估方法论前面 3 篇 R1 系列博文里，我们训练了 Llama-3.1-8B + GRPO 跑了 4 小时、生成了 800K CoT 数阅读全文

posted @ 2026-06-20 18:22 左扬阅读(13) 评论(0) 推荐(0)

DeepSeek-R1 训练与算法（Training & Algorithms）【左扬精讲】—— GRPO 进阶算法：DAPO / PRIME / RLVR / PRM 四大 2025 前沿改进

摘要： DeepSeek-R1 训练与算法（Training & Algorithms）【左扬精讲】—— GRPO 进阶算法：DAPO / PRIME / RLVR / PRM 四大 2025 前沿改进上一篇 R1 GRPO 实战我们跑了 4 小时 GRPO 训练，pass@1 从 75.2% 涨到 82 阅读全文

posted @ 2026-06-20 18:17 左扬阅读(30) 评论(0) 推荐(0)

左扬(你们的胃叫胃，孤的叫胃PLUS)

知命不惧，日日维新（云原生运维基础架构SRE+中间件架构+GO/Java/JavaScript/TypeScript/Python/Rust开发架构，多线深耕）

公告