摘要: 1、众所周知,可商用的成熟大模型训练分四个步骤: pre-train:大量未标记的语料做auto-regression,此步骤初步完成LLM权重的赋值。经过此阶段的LLM,类似人类小学生的水平,还无法有针对性的回答问题; supervised Fine-tuning:用 {instruction,i 阅读全文
posted @ 2025-01-13 14:52 第七子007 阅读(220) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示