自然语言处理 Paddle NLP - 机器同传技术及应用-理论

基础
自然语言处理(NLP)
自然语言处理PaddleNLP-词向量应用展示
自然语言处理(NLP)-前预训练时代的自监督学习
自然语言处理PaddleNLP-预训练语言模型及应用
自然语言处理PaddleNLP-文本语义相似度计算(ERNIE-Gram)
自然语言处理PaddleNLP-词法分析技术及其应用
自然语言处理PaddleNLP-快递单信息抽取
理解
自然语言处理PaddleNLP-信息抽取技术及应用
自然语言处理PaddleNLP-基于预训练模型完成实体关系抽取--实践
自然语言处理PaddleNLP-情感分析技术及应用-理论
自然语言处理PaddleNLP-情感分析技术及应用SKEP-实践
问答
自然语言处理PaddleNLP-检索式文本问答-理论
自然语言处理PaddleNLP-结构化数据问答-理论
翻译
自然语言处理PaddleNLP-文本翻译技术及应用-理论
自然语言处理PaddleNLP-机器同传技术及应用-理论
对话
自然语言处理PaddleNLP-任务式对话系统-理论
自然语言处理PaddleNLP-开放域对话系统-理论
产业实践
自然语言处理 Paddle NLP - 预训练模型产业实践课-理论

视频:https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedLesson=1490529&sharedType=2&sharedUserId=2631487&ts=1687144071539
课件:https://aistudio.baidu.com/aistudio/course/introduce/24177?sharedLesson=1567917&sharedType=2&sharedUserId=2631487&ts=1687144083956

机器同传技术及应用

  1. 从机器翻译到机器同传
  2. 同传关键问题与解决方案
  3. 中英语音翻译数据集——BSTC
  4. 同传研究和落地问题探讨

从机器翻译到机器同传

信息传递效率高:3-4秒延迟
任务难度大:15-20分钟需要休息

  • 源语言:监听、记忆、理解
  • 目标语言:组织、修正、表达
    image
    image
    image
    image

同传关键问题与解决方案

  • 难点一、语音识别错误带来噪声
  • 难点二、平衡翻译效果和时延的Policy

同传模型举例——以信息单元为粒度的同传模型
image
image
image
image
image
image
同传关键问题与解决方案
语音识别错误带来噪声 => 更鲁棒的ASR
高翻译准确和低延时之间矛盾 => Policy
image
image
image
image
image
image
平衡翻译质量与延时——Policy
https://github.com/PaddlePaddle/PaddleNLP/blob/develop/examples/simultaneous_translation/stacl/
image
image
image
image
image

中英语音翻译数据集——BSTC

image
image
image
image

同传研究和落地问题探讨

image

posted @ 2023-06-28 08:11  VipSoft  阅读(91)  评论(0编辑  收藏  举报