会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
左扬(你们的胃叫胃,孤的叫胃PLUS)
知命不惧,日日维新(云原生运维基础架构SRE+中间件架构+GO/Java/JavaScript/TypeScript/Python/Rust开发架构,多线深耕)
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
···
68
下一页
2026年6月22日
Kubernetes 编程 / Operator 专题【左扬精讲】—— 定义 Application 资源 + 添加自定义新 API 完整指南
摘要: K8s 编程 / Operator 专题【左扬精讲】—— 定义 Application 资源 + 添加自定义新 API 完整指南 Operator 是 Kubernetes 的扩展机制,它让开发者能够用自定义资源(CR)和自定义控制器来管理复杂的应用状态。但很多开发者在入门 Operator 开发时
阅读全文
posted @ 2026-06-22 18:13 左扬
阅读(3)
评论(0)
推荐(0)
2026年6月21日
Kubernetes 源码【左扬精讲】—— kube-scheduler(调度专题 · 九):内部架构与核心组件
摘要: Kubernetes 源码【左扬精讲】—— kube-scheduler(调度专题 · 八):内部架构与核心组件 本篇是 kube-scheduler 调度专题的开篇。kube-scheduler 是 Kubernetes 控制平面的"大脑"——它负责将未调度的 Pod 分配到最合适的节点上。这个看
阅读全文
posted @ 2026-06-21 16:54 左扬
阅读(6)
评论(0)
推荐(0)
Kubernetes 源码【左扬精讲】—— kube-scheduler(调度专题 · 八): —— 从入口到调度的全链路源码剖析(k8s v1.36.1)
摘要: Kubernetes 源码【左扬精讲】—— kube-scheduler(调度专题 · 八): —— 从入口到调度的全链路源码剖析(k8s v1.36.1) Pod 是 k8s 最基本的调度单位。当用户提交一个 Pod(或 Deployment、StatefulSet 等工作负载)时,kube-sc
阅读全文
posted @ 2026-06-21 16:22 左扬
阅读(5)
评论(0)
推荐(0)
2026年6月20日
DeepSeek-R1 多模态 R1 / VLM-GRPO【左扬精讲】—— Qwen2-VL 微调与视觉推理强化学习实战
摘要: DeepSeek-R1 多模态 R1 / VLM-GRPO【左扬精讲】—— Qwen2-VL 微调与视觉推理强化学习实战 前面 6 篇 R1 系列博文覆盖了纯文本的 R1 训练 / 数据 / 评估 / 部署 / 端侧 / 推理时扩展。但 2025 年 LLM 最大的趋势是多模态——模型不仅能"读"文
阅读全文
posted @ 2026-06-20 18:32 左扬
阅读(16)
评论(0)
推荐(0)
DeepSeek-R1 工业 RAG + 微调混合系统【左扬精讲】—— R1 系列收官之作:从 Prompt → RAG → 微调 选型决策树
摘要: DeepSeek-R1 工业 RAG + 微调混合系统【左扬精讲】—— R1 系列收官之作:从 Prompt → RAG → 微调 选型决策树 R1 系列 7 篇博文讲完了训练 / 蒸馏 / 评估 / 部署 / 端侧 / 推理 / 多模态的完整链路。但工程团队最常问:"我有一个新业务,到底该用 Pr
阅读全文
posted @ 2026-06-20 18:32 左扬
阅读(15)
评论(0)
推荐(0)
DeepSeek-R1 推理时扩展【左扬精讲】—— o1 / R1 慢思考机制:Self-Consistency + ToT + PRM 详解
摘要: DeepSeek-R1 推理时扩展【左扬精讲】—— o1 / R1 慢思考机制:Self-Consistency + ToT + PRM 详解 前面 5 篇 R1 系列博文覆盖了训练(GRPO + DAPO + PRIME)、数据(800K 蒸馏)、评估、部署(vLLM+K8s)、端侧。但 R1 最
阅读全文
posted @ 2026-06-20 18:30 左扬
阅读(8)
评论(0)
推荐(0)
DeepSeek-R1 端侧 LLM 工程【左扬精讲】—— llama.cpp 调参与 Apple Silicon / 国产 NPU / Android 端侧落地全攻略
摘要: DeepSeek-R1 端侧 LLM 工程【左扬精讲】—— llama.cpp 调参与 Apple Silicon / 国产 NPU / Android 端侧落地全攻略 前面 4 篇博文覆盖了 R1 训练(GRPO)、数据(800K 蒸馏)、评估(LLM-as-Judge)、部署(vLLM+K8s)
阅读全文
posted @ 2026-06-20 18:29 左扬
阅读(33)
评论(0)
推荐(0)
DeepSeek-R1 vLLM + k8s 生产部署【左扬精讲】—— 从单卡 7B 到 100 卡 671B MoE 集群的工业化部署实战
摘要: DeepSeek-R1 vLLM + k8s 生产部署【左扬精讲】—— 从单卡 7B 到 100 卡 671B MoE 集群的工业化部署实战 前面 4 篇 R1 系列博文覆盖了训练(GRPO 4 小时实验)、数据(800K CoT 蒸馏工厂)、评估(三层评估体系)。但有一个终极问题始终没讲:训练好、
阅读全文
posted @ 2026-06-20 18:27 左扬
阅读(17)
评论(0)
推荐(0)
DeepSeek-R1 评估与系统(Evaluation & Systems)【左扬精讲】—— 从 GSM8K/MMLU 到 LLM-as-Judge 的工业级评估方法论
摘要: DeepSeek-R1 评估与系统(Evaluation & Systems)【左扬精讲】—— 从 GSM8K/MMLU 到 LLM-as-Judge 的工业级评估方法论 前面 3 篇 R1 系列博文里,我们训练了 Llama-3.1-8B + GRPO 跑了 4 小时、生成了 800K CoT 数
阅读全文
posted @ 2026-06-20 18:22 左扬
阅读(13)
评论(0)
推荐(0)
DeepSeek-R1 训练与算法(Training & Algorithms)【左扬精讲】—— GRPO 进阶算法:DAPO / PRIME / RLVR / PRM 四大 2025 前沿改进
摘要: DeepSeek-R1 训练与算法(Training & Algorithms)【左扬精讲】—— GRPO 进阶算法:DAPO / PRIME / RLVR / PRM 四大 2025 前沿改进 上一篇 R1 GRPO 实战我们跑了 4 小时 GRPO 训练,pass@1 从 75.2% 涨到 82
阅读全文
posted @ 2026-06-20 18:17 左扬
阅读(30)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
···
68
下一页
公告