02 2025 档案

使用 Python 调用 DeepSeek R1 深度思考模型 API 接口

摘要：DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的阅读全文

posted @ 2025-02-05 11:15 charescape 阅读(5047) 评论(0) 推荐(0) 编辑