推荐 | 最新书籍《大语言模型》

大语言模型LLM综述文章《A Survey of Large Language Models》已经更新到第13个版本。该综述系统梳理LLM的研究进展与核心技术,讨论了大量的相关工作。

2023年12月底作者们继续启动了中文书的编写工作,并且于近期完成初稿。与英文综述定位不同,中文书籍更注重大模型技术的入门,在内容上进行了大幅更新与重组,力图展现一个整体的LLM技术框架和路线图。

本书适用于具有深度学习基础的高年级本科生以及低年级研究生使用,可以作为一本入门级的参考资料。

中文书项目链接(可免费下载):

https://llmbook-zh.github.io/

LLM发展时间线

LLaMA 系列模型的衍生工作进化图

GitHub Issue:https://github.com/LLMBook-zh/LLMBook-zh.github.io/issues

配套资源

大模型代码工具库LLMBox:一个为大语言模型的创建和应用而设计的综合性平台。它采用标准化的培训程序和全面的评估系统,以提供一种高效、灵活的解决方案,用于训练和部署这些高级模型。平台内嵌了多种实用工具,以增强在模型开发和应用过程中的效率和灵活性。链接:https://github.com/RUCAIBox/LLMBox。

YuLan大模型:由中国人民大学高瓴人工智能学院的师生团队联合研发,是一个专为对话而设计的先进语言模型。该系列模型的命名灵感来源于该校的校花“玉兰”。在最新版中,模型从零开始进行了完整的预训练,并利用课程学习技术,针对中英文双语数据进行了有监督的微调。这一过程中,特别注重了高质量指令和人类偏好数据的整合。链接:https://github.com/RUC-GSAI/YuLan-Chat。

posted @ 2024-06-16 11:00  生物信息与育种  阅读(12)  评论(0编辑  收藏  举报