Model | 作者 | Size | 类型 | 开源? |
---|---|---|---|---|
LLaMa | Meta AI | 7B-65B | Decoder | open |
OPT | Meta AI | 125M-175B | Decoder | open |
T5 | 220M-11B | Encoder-Decoder | open | |
mT5 | 235M-13B | Encoder-Decoder | open | |
UL2 | 20B | Encoder-Decoder | open | |
PaLM | 540B | Decoder | no | |
LaMDA | 2B-137B | Decoder | no | |
FLAN-T5 | 同T5 | Encoder-Decoder | open | |
FLAN-UL2 | 同U2 | Encoder-Decoder | open | |
FLAN-PaLM | 同PaLM | Decoder | no | |
FLAN | 同LaMDA | Decoder | no | |
BLOOM | BigScience | 176B | Decoder | open |
T0 | BigScience | 3B | Decoder | open |
BLOOMZ | BigScience | 同BLOOM | Decoder | open |
mT0 | BigScience | 同T0 | Decoder | open |
GPT-Neo | EleutherAI | 125M-2.7B | Decoder | open |
GPT-NeoX | EleutherAI | 20B | Decoder | open |
GPT3 | OpenAI | 175B (davinci) | Decoder | no |
GPT4 | OpenAI | unknown | OpenAI | no |
InstructGPT | OpenAI | 1.3B | Decoder | no |
Alpaca | Stanford | 同LLaMa | Decoder | open |
参考资料:
https://blog.csdn.net/jarodyv/article/details/129992142 开源大语言模型(LLM)汇总(持续更新中)
https://zhuanlan.zhihu.com/p/611403556 腾讯算法工程师 总结当下可用的大模型LLMs
2024全年中文大模型基准测评 图挺漂亮
https://blog.csdn.net/bqw18744018044/article/details/128908060 BLOOM:一个176B参数且可开放获取的多语言模型
https://mp.weixin.qq.com/s/Q3BihZjpAonVIfNuFUOVmQ 百模大战时代,思考大模型的未来格局
https://mp.weixin.qq.com/s/SAlWXzdqc-wIyrFEc9ujJA 国产108个大模型,谁是36天罡?谁是72地煞?百模争霸排行榜
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)