随笔 - 304 文章 - 0 评论 - 35 阅读 - 18万

[转载]OpenBMB：让大模型飞入千家万户

预训练大模型的三大挑战：
▶ 训练难：训练数据量大，算力成本高。
▶ 微调难：微调参数量大，微调时间长。
▶ 应用难：推理速度慢，响应时间长，难以满足线上业务需求。

https://mp.weixin.qq.com/s/leUQz3VcyCkfY6Xx2G39mg

官网 https://www.openbmb.org/home

已经入驻模型：CPM1、CPM2、EVA

CPM1是一个拥有26亿参数的生成式中文预训练语言模型。
CPM1的模型架构与GPT类似，它能够被应用于广泛的自然语言处理任务，如对话、文章生成、完形填空和语言理解。
CPM2是一个拥有110亿参数的通用中英文双语预训练语言模型，基于encoder-decoder架构。CPM2具有7种通用语言能力。
2021年9月CPM2推出升级版本CPM2.1，CPM2.1新增了生成式的预训练任务并基于持续学习范式进行训练，生成能力进行了大幅度强化。
EVA 是一个28亿参数的中文预训练对话模型，基于encoder-decoder架构。
EVA在很多对话任务上表现优异，尤其是在多轮人机交互对话任务上。

git地址：https://github.com/OpenBMB

posted on 2022-04-18 15:24 宋岳庭阅读(212) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 清华GLM

· 模型+数据=新模型

· 人工智能大模型之开源大语言模型汇总（国内外开源项目模型汇总）

· 人工智能大模型之开源大语言模型汇总（国内外开源项目模型汇总）

· 带你了解大语言模型的前世今生

阅读排行：
· 开源Multi-agent AI智能体框架aevatar.ai，欢迎大家贡献代码
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后，我竟然真的恢复了删除的微信聊天记录！
· 没有Manus邀请码？试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY

积跬步，至千里。

昵称：宋岳庭
园龄： 5年7个月
粉丝： 25
关注： 1

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类

随笔档案

相册

文章用图(5)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:wikitext数据集
666，数据集链接可以下载
--切可拉夫斯基
2. Re:ALBEF图文检索
@Chendachen 你好，json文件怎么获取？...
--一个派大星
3. Re:ALBEF图文检索
@一玎你好，我有json文件需要可以联系交流一下...
--Chendachen
4. Re:BARTScore试试
这指标怎么看？越大越好还是越小越好
--silverbeats
5. Re:ALBEF图文检索
博主你好，请问train,test,val的json文件如何获取呢？
--一玎