摘要: 本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练,使模型能够有效地利用这些新增token。以Llama 3.2模型为基础,实现了类似DeepSeek R1中think和answer标记功能的扩展方法,通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分。![] 本文聚焦 阅读全文
posted @ 2025-02-28 20:47 deephub 阅读(5) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示