2023-8-24 大型语言模型的科学挑战 2023 人工智能大会青年科学家论坛

大型语言模型的科学挑战 | 2023 人工智能大会青年科学家论坛

复旦大学 邱锡鹏

MOSS模型开发过程

  • 中文预训练基座(CPT, CBART)2021.9

  • 对话模型(MOSS)2023.2

  • 工具增强(MOSS-Plugin)2023.4

大模型时代,自然语言处理还存在吗?

V1

输入

基础模型

词法分析

信息抽取

特定任务

输出

V2

输入

基础模型

词法分析

信息抽取

特定任务

输出

V3

输入

LLMs

输出

  • 生成范式为主流

    • 代表模型:Google BERT
    • S2S: Google T5
    • LM: ChatGPT
  • 大模型带来的问题

    • 同质化严重
    • 赛道拥挤
    • 重回特征工程
    • 算力高消耗高
    • 评估困难

大模型的科学价值

  1. 基于Transformer的语言模型(自然语言的语义组合)
  2. 思维链能力来源
  3. 大模型训练目标(端到端训练减少泛化误差)
  4. “幻觉”(模型生成不正确无意义的文本)

当前多模态模型

  • Modality-specific encoder
  • Multi-model input -> text output
  • Text instructions
  • Continous encoding

SpeechGPT模型

  • 接入语音离散化导入GPT
  • 实现跨模态接入(实现多语言,多方式输出)
posted @   SweepyZhou  阅读(52)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示