让照片说话之SadTalk

西安交通大学开源了人工智能SadTalker模型，通过从音频中学习生成3D运动系数，使用全新的3D面部渲染器来生成头部运动，可以实现图片+音频就能生成高质量的视频。内含多个踩坑的解决办法，值得玩一玩。

windows运行环境构建

Install Python 3.10.6
Install git manually
Install ffmpeg

sadtalker安装

git clone https://github.com/Winfredy/SadTalker.git

posted @ 2023-09-04 12:13 李嘉伦伦伦伦阅读(132) 评论(0) 收藏举报

刷新页面返回顶部