11.25

事实上,DeepSeek 的成功并非偶然。这家由中国知名量化私募巨头幻方量化于 2023 年创立的公司,在成立仅半年后就推出了第一代大模型 DeepSeek Coder,这一模型不仅免费商用,还完全开源。

不过,在当时的百模大战中,DeepSeek 发布的新模型或许并未引起太多关注。然而,令人意想不到的是,在后来各大科技巨头掀起大模型价格战之前,DeepSeek 已率先打破常规,大胆掀翻了大模型价格的“桌子”,吸引了众多目光。

深挖之后,众人才发现,这家较为低调 AI 初创公司其实早深耕 AI 领域多年且极具前瞻性,早在 2019 年,幻方量化就投资了 2 亿元自主研发深度学习训练平台“萤火一号”,搭载了 1100 块 GPU,到了 2021 年幻方量化对“萤火二号”投入增加到 10 亿元,且搭载了约 1 万张英伟达 A100 显卡,而在当时,国内拥有超过 1 万枚 GPU 的企业屈指可数,不超过 5 家。

posted @   SDGVSBGDRH  阅读(15)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
点击右上角即可分享
微信分享提示