会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
代码改变世界
Posts - 18, Articles - 0, Comments - 33, Views -
42564
Cnblogs
Dashboard
Login
Home
Contact
Gallery
Subscribe
RSS
曾左
随笔档案-2025年01月
DeepSeek V3 两周使用总结
2025-01-22 09:25 by 曾左, 8187 阅读,
收藏
,
编辑
摘要: 2024 年 12 月 26 日,杭州深度求索人工智能基础技术研究有限公司发布 DeepSeek-V3 大模型。官方宣称:(1)基于自研的 MoE 模型和 671B 参数,在 14.8T token 上进行了预训练;(2)多项评测成绩超越了 Qwen2.5 - 72B 和 Llama - 3.1 -
阅读全文
8 Comment
About
昵称:
曾左
园龄:
4年
粉丝:
6
关注:
1
+加关注
随笔档案
2025年2月(1)
2025年1月(1)
2024年12月(2)
2024年9月(2)
2024年8月(1)
2024年7月(3)
2024年4月(1)
2024年3月(2)
2023年12月(1)
2022年8月(1)
2022年4月(1)
2021年12月(2)
随笔分类
Git(1)
Http(1)
Java(1)
Linux(3)
LLM(1)
Nginx(1)
Python 工程化(3)
Serverless(1)
规章制度(2)
面试(1)
前端(1)
网络(2)
新技术探索(2)
点击右上角即可分享