书生·浦语大模型全链路开源体系——学习笔记

学习来源：https://www.bilibili.com/video/BV1Rc411b7ns/

资料来源：https://github.com/InternLM/tutorial/discussions/36 （有同学发pdf，还有其他同学的笔记）

俺没啥知识积累，很多信息不太会折叠。姑且做个笔记试试。

引言

大模型，简称通用大模型，能够一个模型解决多种类型的问题。也许可能把人脸识别、打牌下棋、语音识别给学会？

书生·浦语大模型，为社区贡献了很多数据和模型。

模型可以分，轻量，中量，重量，分别是7b，20b，123b。大概是用两个轴来划分，一个是体量、成本、规模限制；另一个是tokens、语境、推理、理解能力。二者不可兼得。

打分，能体现不同模型之间的差距。internLM在开源大模型里吊打同类。

如何应用？

考虑：业务场景复杂度、算力要求、交互要求。最后测评并部署。

图片比文字要清楚多

浦生提供了大模型的全链条：数据-预训练-微调-部署-评测-应用

接下来介绍每个环节分别有什么和做什么？

产生问题：

不知道从什么小项目着手开始做比较好

备份几张感觉接下来或许能用得上的ppt

posted @ 2024-01-05 11:06 windiest 阅读(53) 评论(0) 编辑收藏举报

刷新页面返回顶部