IMPRINT：通过学习身份保持表示进行生成对象合成

IMPRINT：通过学习身份保持表示进行生成对象合成

生成对象合成作为合成图像编辑的一种有前景的新途径出现了。然而，对象身份保存的要求带来了重大挑战，限制了大多数现有方法的实际使用。作为回应，介绍了IMPRINT，这是一种基于扩散的生成模型，采用两阶段学习框架进行训练，将身份保持学习与合成学习解耦。第一阶段的目标是对对象编码器进行上下文无关、身份保持的预训练，使编码器能够学习一种视图不变且有助于增强细节保持的嵌入。后续阶段利用这种表示来学习合成到背景的对象的无缝协调。此外，IMPRINT还包含一个形状引导机制，为用户提供对合成过程的直接控制。

大量实验表明，IMPRINT在身份保持和合成质量方面明显优于现有方法和各种基线。

与之前的作品进行比较、给定一个粗糙的遮罩，如图3-35所示。

图3-35 与之前的作品进行比较、给定一个粗糙的遮罩

在图3-35中，顶部：与之前的三部作品进行比较，即按示例绘制、对象缝合和TF-ICON。IMPRINT方法在身份保持和颜色/几何协调方面优于其他方法。底部：给定一个粗糙的遮罩，IMPRINT可以改变对象的姿势以遵循遮罩的形状。

改进IMPRINT的两阶段训练管道，上下文无关的ID保持阶段和对象合成阶段，如图3-36所示。

图3-36 改进IMPRINT的两阶段训练管道

在图3-36中，包括以下结论：

（a）上下文无关的ID保持阶段：设计了一种新的图像编码器（以预训练的DINOv2为骨干），该编码器在多视图对象对上训练，以学习视图不变的ID保持表示。

（b）对象合成阶段：从第一阶段获取学习到的图像编码器并冻结其骨干，对整个模型进行训练，将对象合成到掩蔽区域。

posted @ 2024-11-17 17:24 吴建明wujianming 阅读(9) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 通过渐进式混合语境扩散完成Amodal

· 计算机视觉几个应用

· 人脸生成：Beyond Face Rotation: Global and Local Perception GAN

· 论文解读-《Deep Image Blending》

· CIAGAN: Conditional Identity Anonymization Generative Adversarial Networks阅读笔记

阅读排行：
· 全程不用写代码，我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· .NET10 - 预览版1新功能体验（一）

历史上的今天：
2023-11-17 RV64-64位地址指令分析
2022-11-17 LLVM IR Theories指南
2022-11-17 AMD自动泊车-编程流派-台积电-5G基带芯片分析
2021-11-17 c++ Factor泛型编程示例

公告

昵称：吴建明wujianming
园龄： 7年5个月
粉丝： 532
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:云计算服务器技术市场分析
Super Pi linux工具可以提供下吗？网上包括官方的都没法在centos、ubuntu os下跑，

xuxu8511@163.com 多谢。
--xu111122
2. Re:RISC-V指令列表分析
jalr中的14到12位应该为000而不是010吧
--洛天V
3. Re:《LLVM编译器原理与实践》新书推荐（已出版）
已买，学习中，支持博主
--tieyan
4. Re:NPU与超异构计算杂谈
好文章，很详细的对异构做了Overview！感谢大佬🫡
--kaiZH
5. Re:《LLVM编译器原理与实践》新书推荐（已出版）
这本书中对于LLVM垃圾回收机制statepoint有做研究吗？或者博主有推荐的资料吗？官网的资料确实比较晦涩难懂而且没有案例。
--wingrez