蝈蝈俊的技术心得

随笔 - 934, 文章 - 0, 评论 - 247, 阅读 - 344万

导航

公告

昵称：蝈蝈俊
园龄： 14年11个月
粉丝： 300
关注： 4

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:如何理解RAG的尽头是Agent
举的例子很形象！
--oak_Jiao
2. Re:Mac下Microsoft Remote Desktop 中国区无法下载问题解决
这个方案的缺点是经常会碰到更新，更新很频繁
--蝈蝈俊
3. Re:LinkedIn：怎么稳定的让 LLM 返回结构化数据？
搜个东西都能刷到你真够烦的你最好是个好人
--wwwyyy97
4. Re:SQL Server 数据格式修改时，没有保存按钮的情况解决
赞，解决问题了，感谢
--csshaw
5. Re:Ollama 运行 GGUF 模型
您好，我有一个问题想要咨询一下，我发现在本地离线下载的gguf只有1个，但是huggingface上面是有多个gguf文件的，这会导致我们本地ollama部署的这个模型没有全部gguf读入的模型效果差...
--Yuan_blog

2025年2月10日

DeepSeek-R1的四个训练阶段

摘要： DeepSeek-R1的训练流程包含四个阶段，分为两个强化学习（RL）阶段和两个监督微调（SFT）阶段。 https://github.com/deepseek-ai/DeepSeek-R1 第一阶段：Cold Start（冷启动，SFT阶段）要解决的问题初始不稳定性和可读性差：直接从基模型启动阅读全文

posted @ 2025-02-10 08:45 蝈蝈俊阅读(1360) 评论(0) 推荐(0) 编辑