2025 年 2月 28 日随笔档案 - deephub

2025年2月28日

LLM模型添加自定义Token代码示例：为Llama 3.2模型添加思考与回答标记

摘要：本文将介绍如何为大型语言模型(LLM)添加自定义token并进行训练，使模型能够有效地利用这些新增token。以Llama 3.2模型为基础，实现了类似DeepSeek R1中think和answer标记功能的扩展方法，通过监督微调使模型学习使用这些标记进行推理过程与答案输出的区分。![] 本文聚焦阅读全文

posted @ 2025-02-28 20:47 deephub 阅读(5) 评论(0) 推荐(0) 编辑

公告

我们的网站：

提供专业的人工智能知识，涉及领域包括CVNLP和数据挖掘等

overfit深度学习

AI方向干货分享，喜欢请关注我们公众号

昵称： deephub
园龄： 4年11个月
粉丝： 10
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

deephub

overfit深度学习

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论