2023-8-24 大型语言模型的科学挑战 2023 人工智能大会青年科学家论坛
大型语言模型的科学挑战 | 2023 人工智能大会青年科学家论坛
复旦大学 邱锡鹏
MOSS模型开发过程
-
中文预训练基座(CPT, CBART)2021.9
-
对话模型(MOSS)2023.2
-
工具增强(MOSS-Plugin)2023.4
大模型时代,自然语言处理还存在吗?
-
生成范式为主流
- 代表模型:Google BERT
- S2S: Google T5
- LM: ChatGPT
-
大模型带来的问题
- 同质化严重
- 赛道拥挤
- 重回特征工程
- 算力高消耗高
- 评估困难
大模型的科学价值
- 基于Transformer的语言模型(自然语言的语义组合)
- 思维链能力来源
- 大模型训练目标(端到端训练减少泛化误差)
- “幻觉”(模型生成不正确无意义的文本)
当前多模态模型
- Modality-specific encoder
- Multi-model input -> text output
- Text instructions
- Continous encoding
SpeechGPT模型
- 接入语音离散化导入GPT
- 实现跨模态接入(实现多语言,多方式输出)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律