摘要: 1. DeepSeek蒸馏技术概述 1.1 蒸馏技术定义与原理 模型蒸馏(Knowledge Distillation)是一种将大型复杂模型(教师模型)的知识迁移到小型高效模型(学生模型)的技术。其核心目标是在保持模型性能的同时,显著降低模型的计算复杂度和存储需求,使其更适合在资源受限的环境中部署。 阅读全文
posted @ 2025-02-20 09:50 雨梦山人 阅读(341) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示