摘要: 用于讲话者视听追踪,基于自监督学习的多模态感知注意力网络——论文阅读 本文是在阅读原论文的过程中的一些学习笔记和自我理解,若有不当,敬请勘误。 1.摘要 概念解释 端到端模型:输入和输出之间没有中间步骤或阶段。端到端模型直接从原始输入数据映射到最终输出结果,没有人为设计的特征提取,中间表示或者预处理 阅读全文
posted @ 2024-04-07 12:37 zakarRoman 阅读(8) 评论(0) 推荐(0) 编辑