2023 年 10月 15 日随笔档案 - 张博的博客

2023年10月15日

数字人论文:Audio-Driven Facial Animation by Joint End-to-End Learning of Pose and Emotion

摘要：老规矩. 直接第三章 3. 端到端网络结构给一个audio 短窗口, 也就是片段. 我们预测窗口中间时刻的面部表情. 我们把表情看做一个全端点的向量 (后面我们会看这是什么的一种刻画面部) 一旦我们网络训完, 我们回各个时间点同时生成, 并行. 即使不需要过去的帧画面, 依然生成很稳定的画面. ( 阅读全文

posted @ 2023-10-15 22:51 张博的博客阅读(73) 评论(0) 推荐(0) 编辑

张博的博客

导航