Deepseek V3 —— 6850亿参数混合专家(MoE)架构开源大模型!Deepseek V3全方位客观评测文档处理、逻辑推理、算法编程等多维度的真实能力水平

地址:

https://www.youtube.com/watch?v=BnoMTeKxwBQ



image


image






🚀当Deepseek v3遇上贪吃蛇:一个简单游戏实现背后,揭示最新开源大模型在复杂编程场景下的短板与不足
🚀本期视频我们详细测试了Deepseek最新发布的开源大模型Deepseek V3的综合能力。这款模型采用混合专家架构,总参数为685B,包括了256个专家模型,训练数据截止日期为2024年7月。
🚀我们从版本信息、知识库截止日期、PDF文件处理、提示词遵循、逻辑推理、编程和算法等多个方面对Deepseek V3进行了测试。测试发现:
✅对基于思维链的提示词遵循能力很强
✅在一些逻辑推理题上表现一般,有时会给出错误或不完整的答案
✅质数算法题中,给出的代码没有经过优化,执行效率很低
✅在其他一些算法题的表现参差不齐,有的可以给出正确答案,有的不行
✅在实现一个稍微复杂的贪吃蛇游戏时,经过多轮修改代码依然存在逻辑问题无法正常运行
✅相比之下,Claude模型可以一次性给出逻辑正确、功能完备的贪吃蛇游戏代码。

👉👉👉视频中所用到的指令 https://blog.stoeng.site/20241225.html
👉👉👉我的开源项目 https://github.com/win4r/AISuperDomain



posted on   Angry_Panda  阅读(281)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2023-12-31 如何将python的pip源设置为阿里云
2023-12-31 国产深度学习框架吸引用户的一种免费手段——免费GPU时长
2023-12-31 利用强化学习算法解释人类脑对高维状态的抽象表示:how humans can map high-dimensional sensory inputs in actions
2020-12-31 Ubuntu18.04系统下 临时使用 socks5代理apt-get的方法
2018-12-31 好玩的Python库tqdm (转载)
2018-12-31 Python 第三方库 进度条模块 tqdm的使用方法
2018-12-31 从 Python 第三方进度条库 tqdm 谈起 (转载)

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示