ddpm损失函数

ddpm损失函数

从本文开始正式介绍ddpm损失函数。在扩散模型推导前置中我们首次介绍了最大化似然的目标,通过逆向过程p计算x0概率最大化就可以生成图片

E[logpθ(x0)]Eq[logpθ(x0:T)q(x1:T|x0)]

pθ(x0:T):=p(xT)t=1Tpθ(xt1|xt)

q(x1:T|x0):=t=1Tq(xt|xt1)

正文

我们将pθ,q带入公式中:

(Eq.1)logpθ(x0:T)q(x1:T|x0)=logp(xT)t=1Tpθ(xt1|xt)t=1Tq(xt|xt1)=logp(xT)logt1Tpθ(xt1|xt)+logt=1Tq(xt|xt1)=logp(xT)t=1Tlogpθ(xt1|xt)+t=1Tlogq(xt|xt1)=logp(xT)t=1Tlogpθ(xt1|xt)+t=1Tlogq(xt1|xt)q(xt)q(xt1)=logp(xT)t=1Tlogpθ(xt1|xt)+t=1Tlogq(xt1|xt)+logq(xT)q(x0)=logp(xT)t=1Tlogpθ(xt1|xt)q(xt1|xt)+logq(xT)q(x0)

Eq.1中q(xT)q(x0)是常量,最大似然估计前两项即可,和附件中公式(3)的计算结果一致:

(Eq.2)Eq[logpθ(x0:T)q(x1:T|x0)]=Eq[logp(xT)t=1Tlogpθ(xt1|xt)q(xt1|xt)]=:L

损失函数引入条件x0

我们在前文逆向过程推导中对q引入了条件x0完成计算,我们针对损失也可以同样引入。我们将Eq.1的最终结果进一步整理,将变量相同的放在一起:

(Eq.3)logpθ(x0:T)q(x1:T|x0)=logp(xT)t=1Tlogpθ(xt1|xt)q(xt1|xt)+logq(xT)q(x0)=logp(xT)q(xT)t=1Tlogpθ(xt1|xt)q(xt1|xt)log(q(x0))logp(xT)q(xT|x0)t=1Tlogpθ(xt1|xt)q(xt1|xt,x0)log(q(x0|x0))(x0)=logp(xT)q(xT|x0)t=1Tlogpθ(xt1|xt)q(xt1|xt,x0)log(q(x0|x0))=logp(xT)q(xT|x0)t=1Tlogpθ(xt1|xt)q(xt1|xt,x0)(q(x0|x0)=1)=logp(xT)q(xT|x0)t>1Tlogpθ(xt1|xt)q(xt1|xt,x0)logpθ(x0|x1)q(x0|xt,x0)(t=1)=logp(xT)q(xT|x0)t>1Tlogpθ(xt1|xt)q(xt1|xt,x0)logpθ(x0|x1)

我们将Eq.3加上期望,最终结果如下:

(Eq.4)Eq[logpθ(x0:T)q(x1:T|x0)]=Eq[logp(xT)q(xT|x0)t>1Tlogpθ(xt1|xt)q(xt1|xt,x0)logpθ(x0|x1)]=Eq[q(xT|x0)logp(xT)q(xT|x0)dxt>1Tq(xt1|xt,x0)logpθ(xt1|xt)q(xt1|xt,x0)dxlogpθ(x0|x1)q(x)dx]=Eq[DKL[q(xT|x0)p(xT)]+DKL[q(xt1|xt,x0)pθ(xt1|xt)]logpθ(x0|x1)](KL)

Eq.4和附件中的公式(5)结果一致。综上我们通过推导最大似然估计的损失直到使用KL散度判断q,p的相似度完成训练目标。在这里我们额外提一下第二项中q(xt1|xt,x0),根据马尔科夫链的性质,这里的x0应该是可以去除的,但是论文保留了,为了结果一致性我们也保留了x0

至此我们完成了background所有内容的介绍,对ddpm论文阅读基本没有太多障碍了。在扩散模型推导前置文章中我们介绍了附件公式(1)(2)(3)左边的内容,在前向过程推导文章中我们介绍了附件公式(2)右(4)的由来,在逆向过程推导文章中我们介绍了附件公式(6)(7)。最终在本文介绍完了附件公式(3)和(5)。

附件(原文background)

ddpm2.png

posted @   PowerZZJ  阅读(29)  评论(0编辑  收藏  举报
编辑推荐:
· 从二进制到误差:逐行拆解C语言浮点运算中的4008175468544之谜
· .NET制作智能桌面机器人:结合BotSharp智能体框架开发语音交互
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
阅读排行:
· C# 13 中的新增功能实操
· Ollama本地部署大模型总结
· 【杭电多校比赛记录】2025“钉耙编程”中国大学生算法设计春季联赛(4)
· 卧槽!C 语言宏定义原来可以玩出这些花样?高手必看!
· langchain0.3教程:从0到1打造一个智能聊天机器人
点击右上角即可分享
微信分享提示