2025 年 2月 12 日随笔档案 - 宁采臣open

2025年2月12日

摘要： DeepSeek-R1 模型微调系列 DeepSeek-R1 模型微调系列一. 前言介绍本文内容：1.1 项目背景1.2 LoRA和 QLoRA 简介1.3 LLaMA 架构和 Qwen 架构LLaMA 架构Qwen 架构二. 环境准备2.1 Unsloth 安装（显卡版本-暂时不用）2.2 创建P 阅读全文

posted @ 2025-02-12 15:15 宁采臣open 阅读(662) 评论(2) 推荐(2) 编辑

公告

昵称：宁采臣open
园龄： 1年9个月
粉丝： 2
关注： 1

+加关注

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔分类

随笔档案

阅读排行榜

评论排行榜

1. 定制化训练DeepSeek模型：LoAR、COT推理与SFT技术应用(2)

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论