:: :: :: ::

::

posts - 929, comments - 588, views - 401万

公告

本BLOG随笔文章不加说明的均为原创，如要转贴，请予说明原作者!

This work is licensed under a Creative Commons Attribution-ShareAlike 3.0 Unported License.

昵称： PetterLiu
园龄： 18年9个月
粉丝： 1070
关注： 1

+加关注

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔分类

随笔档案

文章分类

新闻

相册

Tech(1)

Expert Link

Friend

Technic sites

阅读排行榜

评论排行榜

最新评论

1. Re:信息系统架构演化-AI业务逻辑智能体
这个AI agent 架构设计有落地demo吗
如何实现呢？
--楠木大叔
2. Re:项目管理之风险管理案例-项目交付风险
AI辅助分析后：风险定性分析在项目中，未及时沟通导致了达梦DM8数据库和MySQL数据库的使用不一致。这一问题带来了以下主要风险：技术兼容性风险：由于达梦DM8数据库和MySQL数据库存在较大的...
--PetterLiu
3. Re:设备管理系统AI大模型应用RAG案例
这是谁家的方案，推荐一下。
--LI建军
4. Re:PMP 考试学习助手提示词
上传一本考试题目书，更好匹配知识领域我们也可以直接让他出题 ”请直接从这本书《PMP Exam Preparation: Test Questions, Practice Test, and Sim...
--PetterLiu
5. Re:手工测试与APPSCAN自动化测试结合的提高效率测试策略
正常来说，appscan只适合做安全测试，还有做漏扫出来的缺陷最好人工再排查一下，有的是误报
--非鱼46

2025年1月29日

DeepSeek R1 解题推理实践PMP试题

摘要：题目截图推理解析解题原理强化学习为核心： DeepSeek R1颠覆了传统路线，采用了大规模的强化学习（RL）来激发推理能力。这种学习模式使模型能够在没有或仅有少量监督微调的情况下，通过奖励信号来探索并形成自己的思维链。 DeepSeek R1-Zero更是完全依赖强化学习来习得复杂推理技能，从未进阅读全文

posted @ 2025-01-29 10:48 PetterLiu 阅读(254) 评论(0) 推荐(0) 编辑

搜索

常用链接

我的标签