开源模型 Zephyr-7B 发布——跨越三大洲的合作
最近我们刚刚发布了新的开源模型 Zephry-7B🪁,这个模型的诞生离不开全球三大洲开源社区的协作 ❤️。
我们的 CSO Thomas 录了一个视频介绍了它的起源故事:
✨ 就在几个月前,巴黎的一个新团队发布了他们首个模型: Mistral 7B,这个模型体积小巧但性能强劲,在基准测试中的表现超过了所有同类模型。而且这是个开源模型,这意味着大家都可以在此基础上进行开发。
✨ 开发者 Lewis 在瑞士伯尔尼,Ed 在法国南部里昂,他们俩都是 Hugging Face H4 团队的一员。在 Hugging Face 举办的一次小聚中,他们边喝咖啡边讨论用斯坦福大学新发表的 DPO 方法对模型进行微调的可能性。于是大家决定用他们已经构建好的代码库来尝试一下💪
✨接下来的一天,他们在 HF hub 上找到了一些公开的数据集,主要是由清华的 OpenBMB 团队新近开源的两个大型、高质量的微调数据集: UltraFeedback 和 UltraChat 📊
✨ 经过几轮训练实验,他们的想法得到了证实: 这个新模型非常强大,在伯克利和斯坦福的基准测试中是他们见过的最强模型。Clémentine 是 Hugging Face Open LLM Leaderboard 的领头人,她对模型的深入分析确认了其卓越性能。于是 H4 团队中另一位成员 Sasha Rush 教授迅速起草了一篇研究报告,将所有细节分享给整个社区 📰
✨ 几天后,这个名为 Zephyr 的模型、研究论文以及所有细节都向世界公开了。不久之后,全球各地的公司开始应用这一模型。LlamaIndex,一个知名的数据框架和社区,分享了这个模型在实际用例基准测试中超乎预期的表现。与此同时,研究者和实践者们在 Hugging Face hub 上讨论着这篇论文和相关工作。
✨ 很难相信,这一切的实现仅仅用了几周时间 🤯!这一切都得益于世界各地 (欧洲、加利福尼亚、中国) 对知识、模型、研究和数据集的开放,以及开源社区之间的相互协作 🤝
✨ 这样的故事在开源社区比比皆是,也正是这些人和事让开源社区始终保持不断创新的原动力 🔥
✨ 齐心协力,我们可以一起创造出惊人的成果 ❤️
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库