02 2025 档案

摘要:DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的 阅读全文
posted @ 2025-02-05 11:15 charescape 阅读(5047) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示