扩散模型的极简介绍

在计算机视觉中,生成模型是一类能够生成合成图像的模型。例如,一个被训练来生成人脸的模型,每次都会生成一张从未被该模型或任何人看到过的人脸。生成模型最著名的例子是GAN(生成对抗网络)。它有生成器和鉴别器,它们相互对抗,然后生成图像。由于模型本身具有对抗性,因此很难进行训练。这使得很难达到一个最优的平衡。利用扩散模型可以解决这个问题。(下图为常见的生成模型的基本架构)

扩散模型也是生成模型,扩散模型背后的直觉来源于物理学。在物理学中气体分子从高浓度区域扩散到低浓度区域,这与由于噪声的干扰而导致的信息丢失是相似的。所以通过引入噪声,然后尝试通过去噪来生成图像。在一段时间内通过多次迭代,模型每次在给定一些噪声输入的情况下学习生成新图像。

扩散模型是如何工作的

扩散模型的工作原理是学习由于噪声引起的信息衰减,然后使用学习到的模式来生成图像。该概念也适用于潜在变量,因为它试图学习噪声分布而不是数据分布。噪声分布使用马尔可夫链的概念建模。这使它成为一个概率模型。

完整文章:

https://avoid.overfit.cn/post/320c80293e6643168c1b3eac1468d4c8

posted @ 2022-09-13 10:37  deephub  阅读(436)  评论(0编辑  收藏  举报