OpenAI发布最新论文：DeepSeek和Kimi发现了o1的秘密

论文显示，在IOI 2024中，o3在严格规则下拿到395.64分，达成金牌成就，并且在CodeForces上的表现与人类精英选手相当。论文中特别提到，中国的DeepSeek-R1和Kimi k1.5通过独立研究显示，利用思维链学习（COT）方法，可显著提升模型在数学解题与编程挑战中的综合表现。R1、k1.5是DeepSeek和Kimi在1月20日同时发布的新型推理模型。

该论文通过强化学习（RL）训练的大型语言模型在复杂编码和推理任务上的性能提升，比较了通用推理模型与针对特定领域优化的系统在竞技编程中的表现。研究结果表明，增加强化学习训练计算和测试时计算可显著提升模型性能，使其接近世界顶尖人类选手，这些模型将在科学、编码、数学等领域的AI应用中解锁新的应用体验。

posted @ 2025-02-14 11:29 RalphLauren 阅读(20) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· MySQL 千万级数据量根据（索引）优化查询速度

· Java redisTemplate阻塞式处理消息队列

· OpenAI o1模型揭秘：通过LLMs学习推理能力

· 未来的AI系统将更加“agentic”。不仅仅是完成任务，更能通过推理能力像人类一样逐步解决问题

· DeepSeek开源o1击毙OpenAI，强化学习惊现「啊哈」时刻！网友：AGI来了

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· DeepSeek 开源周回顾「GitHub 热点速览」

公告

昵称： RalphLauren
园龄： 2个月
粉丝： 0
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜