随笔 - 921, 文章 - 0, 评论 - 247, 阅读 - 340万

导航

< 2025年1月 >
29 30 31 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1
2 3 4 5 6 7 8

几家AI公司的八卦

Posted on   蝈蝈俊  阅读(13)  评论(0编辑  收藏  举报

国外的大模型主要就下面几个:

公司 大模型 备注
OpenAi ChatGPT
Anthropic Claude
Google Gemini / Gemma
Meta Llama
Mistral Mistral 法国公司
Microsoft Phi

他们之间有很多联系,在发布版本时,有时会看到有些针对性发布。

Anthropic

Anthropic 是 OpenAI 的劲敌,其核心团队同样是 OpenAI 的创业原班人马。团队因为与OpenAI 理念不合而分家,于2021年成立了新公司 Anthropic。

https://www.aixinzhijie.com/article/6809440

Anthropic 的联合创始人Dario Amodei曾是OpenAI的研究副总裁。因为对OpenAI变成CloseAI感到不满,于是自立门户创建了Anthropic公司。该公司在拿了微软的投资之后,又拿到了谷歌的投资。可以说,Claude与ChatGPT技术同源,但理念不同。

Meta

2023年2月发表的Llama原始研究论文的14位作者中,包括FAIR巴黎团队负责人Antoine Bordes在内的超过一半(7人)AI科学家离开了Meta,其中几位跳槽或创办了 AI 初创公司,或是到大公司,原因与内部算力资源斗争有关。

Mistral

Mistral AI,2023年5月由Meta和Google DeepMind前员工创立。

https://mistral.ai/

https://www.sohu.com/a/720060728_116132

Mistral AI的三位联合创始人中,首席执行官Arthur Mensch(中)曾任Google DeepMind的研究员,参与了包括Flamingo、Chinchilla、Gopher在内的多个DeepMind经典模型,也是Flamingo和Chinchilla的核心贡献者,对多模态、RAG、算法优化等技术有深刻理解。

首席技术官Timothée Lacroix(右)和首席科学家Guillaume Lample(左)此前都是Meta巴黎人工智能实验室的核心研究人员,两人对模型推理、预训练和模型嵌入有深入研究,是Llama和Llama2的核心技术贡献者,并发表过多篇重要学术论文。

相关博文:
阅读排行:
· DeepSeek V3 两周使用总结
· 回顾我的软件开发经历(1)
· C#使用yield关键字提升迭代性能与效率
· 低成本高可用方案!Linux系统下SQL Server数据库镜像配置全流程详解
· 4. 使用sql查询excel内容
点击右上角即可分享
微信分享提示