摘要: 2025春节期间IT圈最火爆的莫过于deepseek了,R1模型利用reinforcement learning掀起了滔天巨浪,一时间deepseek无人不知,无人不晓!但其实和R1同一时间发布的还有kimi k1.5,也是通过强化学习提升reasoning性能的,但可能是因为deepseek做了部 阅读全文
posted @ 2025-02-24 12:22 第七子007 阅读(33) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示