High-Resolution Image Synthesis with Latent Diffusion Models
概
将模型投射到更低维的子空间中, 以节省计算量.
大概流程
-
原本的扩散模型开始和结束都是基于原始的图像空间, 所以如果想要生成特别高清的图像的话所需的计算开销是不菲的.
-
于是作者希望先训练 Encoder, Decoder, 然后首先:
- 将原本的图像 映射到一个低维的隐空间中.
- 然后整个前向扩散和反向恢复的过程都在这个隐空间进行.
- 在实际推断的时候, 假设我们得到了一个隐空间中的一个采样 , 再通过 decoder 映射回来即可.
-
注意, 本文还提出了一种一种 cross-attention 的方式来建模条件分布:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
2019-03-16 Python Revisited Day 07 (文件处理)
2019-03-16 下降方法与梯度下降