随笔- 17 文章- 10 评论- 11 阅读- 57509

ddpm损失函数

从本文开始正式介绍ddpm损失函数。在扩散模型推导前置中我们首次介绍了最大化似然的目标，通过逆向过程 $p$ 计算 $x_{0}$ 概率最大化就可以生成图片

E [- \log p_{θ} (x_{0})] \leq E_{q} [- \log \frac{p_{θ} (x_{0 : T})}{q (x_{1 : T} | x_{0})}]

p_{θ} (x_{0 : T}) := p (x_{T}) \prod_{t = 1}^{T} p_{θ} (x_{t - 1} | x_{t})

q (x_{1 : T} | x_{0}) := \prod_{t = 1}^{T} q (x_{t} | x_{t - 1})

正文

我们将 $p_{θ}, q$ 带入公式中：

\begin{matrix} (Eq.1) & \begin{aligned} - \log \frac{p_{θ} (x_{0 : T})}{q (x_{1 : T} | x_{0})} & = - \log \frac{p (x_{T}) \prod_{t = 1}^{T} p_{θ} (x_{t - 1} | x_{t})}{\prod_{t = 1}^{T} q (x_{t} | x_{t - 1})} \\ = - \log p (x_{T}) - \log \prod_{t - 1}^{T} p_{θ} (x_{t - 1} | x_{t}) + \log \prod_{t = 1}^{T} q (x_{t} | x_{t - 1}) \\ = - \log p (x_{T}) - \sum_{t = 1}^{T} \log p_{θ} (x_{t - 1} | x_{t}) + \sum_{t = 1}^{T} \log q (x_{t} | x_{t - 1}) \\ = - \log p (x_{T}) - \sum_{t = 1}^{T} \log p_{θ} (x_{t - 1} | x_{t}) + \sum_{t = 1}^{T} \log \frac{q (x_{t - 1} | x_{t}) q (x_{t})}{q (x_{t - 1})} \\ = - \log p (x_{T}) - \sum_{t = 1}^{T} \log p_{θ} (x_{t - 1} | x_{t}) + \sum_{t = 1}^{T} \log q (x_{t - 1} | x_{t}) + \log \frac{q (x_{T})}{q (x_{0})} \\ = - \log p (x_{T}) - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t})} + \log \frac{q (x_{T})}{q (x_{0})} \end{aligned} \end{matrix}

Eq.1中 $\frac{q (x_{T})}{q (x_{0})}$ 是常量，最大似然估计前两项即可，和附件中公式(3)的计算结果一致：

\begin{matrix} (Eq.2) & E_{q} [- \log \frac{p_{θ} (x_{0 : T})}{q (x_{1 : T} | x_{0})}] = E_{q} [- \log p (x_{T}) - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t})}] =: L \end{matrix}

损失函数引入条件 $x_{0}$

我们在前文逆向过程推导中对 $q$ 引入了条件 $x_{0}$ 完成计算，我们针对损失也可以同样引入。我们将Eq.1的最终结果进一步整理，将变量相同的放在一起：

\begin{matrix} (Eq.3) & \begin{aligned} - \log \frac{p_{θ} (x_{0 : T})}{q (x_{1 : T} | x_{0})} & = - \log p (x_{T}) - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t})} + \log \frac{q (x_{T})}{q (x_{0})} \\ = - \log \frac{p (x_{T})}{q (x_{T})} - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t})} - \log (q (x_{0})) \\ \Rightarrow - \log \frac{p (x_{T})}{q (x_{T} | x_{0})} - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} - \log (q (x_{0} | x_{0})) & (引 入 条 件 x_{0}) \\ = - \log \frac{p (x_{T})}{q (x_{T} | x_{0})} - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} - \log (q (x_{0} | x_{0})) \\ = - \log \frac{p (x_{T})}{q (x_{T} | x_{0})} - \sum_{t = 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} & (q (x_{0} | x_{0}) = 1) \\ = - \log \frac{p (x_{T})}{q (x_{T} | x_{0})} - \sum_{t > 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} - \log \frac{p_{θ} (x_{0} | x_{1})}{q (x_{0} | x_{t}, x_{0})} & (拆 分 t = 1) \\ = - \log \frac{p (x_{T})}{q (x_{T} | x_{0})} - \sum_{t > 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} - \log p_{θ} (x_{0} | x_{1}) \end{aligned} \end{matrix}

我们将Eq.3加上期望，最终结果如下：

\begin{matrix} (Eq.4) & \begin{aligned} E_{q} [- \log \frac{p_{θ} (x_{0 : T})}{q (x_{1 : T} | x_{0})}] & = E_{q} [- \log \frac{p (x_{T})}{q (x_{T} | x_{0})} - \sum_{t > 1}^{T} \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} - \log p_{θ} (x_{0} | x_{1})] \\ = E_{q} [- \int q (x_{T} | x_{0}) \log \frac{p (x_{T})}{q (x_{T} | x_{0})} d x - \sum_{t > 1}^{T} \int q (x_{t - 1} | x_{t}, x_{0}) \log \frac{p_{θ} (x_{t - 1} | x_{t})}{q (x_{t - 1} | x_{t}, x_{0})} d x - \log p_{θ} (x_{0} | x_{1}) \int q (x) d x] \\ = E_{q} [D_{K L} [q (x_{T} | x_{0}) ‖ p (x_{T})] + D_{K L} [q (x_{t - 1} | x_{t}, x_{0}) ‖ p_{θ} (x_{t - 1} | x_{t})] - \log p_{θ} (x_{0} | x_{1})] & (K L 散 度 定 义) \end{aligned} \end{matrix}

Eq.4和附件中的公式(5)结果一致。综上我们通过推导最大似然估计的损失直到使用KL散度判断 $q, p$ 的相似度完成训练目标。在这里我们额外提一下第二项中 $q (x_{t - 1} | x_{t}, x_{0})$ ，根据马尔科夫链的性质，这里的 $x_{0}$ 应该是可以去除的，但是论文保留了，为了结果一致性我们也保留了 $x_{0}$

至此我们完成了background所有内容的介绍，对ddpm论文阅读基本没有太多障碍了。在扩散模型推导前置文章中我们介绍了附件公式(1)(2)(3)左边的内容，在前向过程推导文章中我们介绍了附件公式(2)右(4)的由来,在逆向过程推导文章中我们介绍了附件公式(6)(7)。最终在本文介绍完了附件公式(3)和(5)。

附件（原文background）

posted @ 2025-03-12 09:24 PowerZZJ 阅读(29) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· C# 13 中的新增功能实操
· Ollama本地部署大模型总结
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛（4）
· 卧槽！C 语言宏定义原来可以玩出这些花样？高手必看！
· langchain0.3教程：从0到1打造一个智能聊天机器人

公告

昵称： PowerZZJ
园龄： 6年4个月
粉丝： 8
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

PowerZZJ

既然选择了远方便只顾风雨兼程

ddpm损失函数

ddpm损失函数

正文

损失函数引入条件 $x_{0}$

附件（原文background）

公告

搜索

常用链接

合集 (2)

随笔分类 (17)

随笔档案 (17)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

PowerZZJ

既然选择了远方 便只顾风雨兼程

ddpm损失函数

ddpm损失函数

正文

损失函数引入条件x0

附件（原文background）

公告

搜索

常用链接

合集 (2)

随笔分类 (17)

随笔档案 (17)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

既然选择了远方便只顾风雨兼程

损失函数引入条件 $x_{0}$