蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

来源: 投稿

作者: 菠萝的海子

2024-07-12 11:22:00

蚂蚁集团发布了开源项目 EchoMimic。据介绍，EchoMimic 不仅能根据人像面部特征和音频来帮人物对口型，还可以结合面部标志点和音频内容生成较为稳定、自然的视频。

GitHub：https://github.com/BadToBest/EchoMimic

EchoMimic 具备较高的稳定性和自然度，通过融合音频和面部标志点（面部关键特征和结构，通常位于眼、鼻、嘴等位置）的特征，可生成更符合真实面部运动和表情变化的视频。

其支持单独使用音频或面部标志点生成肖像视频，也支持将音频和人像照片相结合做出 “对口型” 一般的效果。

下图是 EchoMimic 的工作原理：

EchoMimic 支持多语言（包含中文普通话、英语）及多风格，也可应对唱歌等场景。

访问主页查看更多示例：https://badtobest.github.io/echomimic.html

本站新闻禁止未经授权转载，违者依法追究相关法律责任。授权请联系：oscbianji#oschina.cn

本文标题：蚂蚁集团开源 EchoMimic：支持为人像照片对口型、生成肖像动画视频

本文地址：https://www.oschina.net/news/301682

posted on 2024-07-19 18:01 漫思阅读(288) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 腾讯开源可控视频生成框架 MimicMotion

· 小米发布全新CyberDog 2，体型接近真实小型犬，超80%开源率，100+接口开放

· 分享6款文字语音生成驱动虚拟数字人说话的开源项目

· DeepFaceAI： AI换脸 / AI变声 / 直播短视频

· NVIDIA Omniverse Audio2Face的简介

阅读排行：
· 微软正式发布.NET 10 Preview 1：开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化（本地部署与 API 调用教程）
· DeepSeek R1 简明指南：架构、训练、本地部署及硬件要求
· 没有源码，如何修改代码逻辑？
· NetPad：一个.NET开源、跨平台的C#编辑器

历史上的今天：
2022-07-19 拍下宇宙的韦伯空间望远镜，其飞行软件采用 C++ 编写、内置定制的 JS 解释器
2022-07-19 Hype 4.0（Mac系统）的布局功能
2022-07-19 Immer 入门
2022-07-19 设计克制
2022-07-19 adobe工具软件应用
2022-07-19 高性能动画的
2022-07-19 RN Weex的超过100片

导航

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

公告

昵称：漫思
园龄： 8年11个月
粉丝： 156
关注： 52

最新随笔

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:SQL中update与update select结合语法详解与实例
非常不错
--规格严格-功夫到家
2. Re:好消息，在 Visual Studio 中可以免费使用 GitHub Copilot 了！
有个小瑕疵，介绍收费的图放错啦
--数据的流
3. Re:基于Cesium.js的【3D地球可视化】设计实例，个个炫酷到爆
图片看不到啊
--没心没肺没人性
4. Re:Next.js 开发指南初始篇 | Next.js CLI
加入知识星球，还显示没有权限啊
--双椒拌面
5. Re:Windows、WSL 与 Linux 的性能对比
人家在19年就搬运过的内容，24年了再抄一遍人家的搬运有什么意思呢？还不贴人家搬运的连接。
--orz_2333

支持DeepSeek的编程助手