开源项目备忘-MiniMind

MiniMind通过精心的架构设计和优化,将复杂的语言模型变得简单易用,同时保持了基础的对话能力:

  1. 1. 极致轻量的模型设计
  • • 基础版本仅有25.8M的模型体积,相比GPT-3缩小了7000倍,却依然保持流畅的对话能力和基础的理解能力
  • • 采用创新的模型结构设计,包含拓展共享混合专家(MoE)机制,在保持性能的同时大幅降低参数量
  • • 支持视觉多模态能力,通过MiniMind-V扩展实现图文理解功能,为应用提供更多可能

 • 复现(蒸馏/RL)大型推理模型DeepSeek-R1的MiniMind-Reason模型,数据+模型全部开源!

MiniMind不仅是一个轻量级语言模型的实现,更是一个展示AI技术本质的项目。它用最简单的方式,让每个对AI感兴趣的人都能亲手搭建一个语言模型,理解其中的原理。在这个AI技术快速发展的时代,我们希望通过这个项目,让更多人能够参与到AI技术的创新中来,用创造的方式去理解和运用AI。

开源地址:
https://github.com/jingyaogong/minimind

posted @   firespeed  阅读(19)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起