Variational Autoencoders and Nonlinear ICA: A Unifying Framework

Khemakhem I., Kingma D. P., Monti R. P. and Hyv"{a}rinen A. Variational autoencoders and nonlinear ICA: a unifying framework. In International Conference on Artificial Intelligence and Statistics (AISTATS), 2020.

本文讨论identifiability的问题, 即

pθ(x)=pθ~(x)θ=θ~

在何种情况下能够成立, 或者近似成立.

主要内容

假设观测数据x和隐变量z满足联合分布:

pθ(x,z)=pθ(x|z)pθ(z),

因为隐变量是未知的, 所以我们接触到的实际上只有边际分布

pθ(x)=zpθ(x,z)dz.

在实际估计参数θ的时候, 很有可能发生:

pθ(x)=pθ~(x)pθ(x),θθ~.

即两个不同的联合分布pθ(x,z),pθ~(x,z)但是却对应着同一个边际分布, 这就identifiability的问题.
在经典的VAE框架中, 已经有工作指出, 无监督下, 即仅凭观测数据x, 是无法保证identifiability的.

本文的模型

本文需要用到一些额外的信息u, 考虑如下分布:

pθ(x,z|u)=pf(x|z)pT,λ(z|u),θ=(f,T,λ).

注: xRd,zRn,uRm.

其中,

x=f(z)+ϵpf(x|z)=pϵ(xf(z)).

pT,λ(z|u)=iQi(zi)Zi(u)exp[j=1kTi,j(zi)λi,j(u)],

即假设先验z|μ满足的是指数族的分布.

套用VAE的框架:

  1. encoder:

T^,λ^=h(x,u;ϕ),zpT^,λ^(z|u).

  1. decoder:

x^=f(z)+ϵ.

既估计的后验分布为qϕ(z|x,μ), 则ELBO:

EqD(x,u)[Eqϕ(z|x,u)[logpθ(x,z|u)logqϕ(z|x,u)]].

Identifiability

定义: 定义等价关系如下:

(f,T,λ)(f~,T~,λ~)A,c,s.t.T(f1(x))=AT~(f~1(x))+c,xX,

其中ARnk×nk. 若A还是个可逆矩阵, 则

(f,T,λ)A(f~,T~,λ~).

显然, 如果

pθ(x|u)=pθ~(x|u)θAθ~,

那么可以说是在线性变换允许范围内是identifiable的.

接下来给出的定理说明了什么时候θ,θ~A-identifiable的.

定理: 在前述定义的模型下, 对于θ=(f,T,λ), 以及任意θ~=(f~,T~,λ~)满足

pθ(x|u)=pθ~(x|u),a.e.,

若一下条件成立, 则θAθ~:

  1. φϵpϵ特征函数(这里即为对于的傅里叶变换), 且φϵ0,a.e..

  2. f是一个单射.

  3. Ti,j几乎处处可微, 且(Tij)j(x)线性独立, 即

jkαijTi,j(x)=ci,x,ci=0,αij=0,j,

对于i=1,,n均成立.

  1. 存在不同的点u0,,unk, 使得

L=(λ(u1)λ(u0),,λ(unk)λ(u0))Rnk×nk.

可逆.

证明流程:
利用条件1, 2证明

pT,λ(f1(x)|u)volJf1(x)=pT~,λ~(f1(x)|u)volJf~1(x).

利用条件4证明

T(f1(x))=AT~(f~1(x))+c,A=LTL~T.

利用条件3证明A可逆.

注: 显然条件四一定程度熵说明了为什么无监督不行(因为其相当于λ(u)为常数).

注: 关于引理2的证明我有疑问, 我认为应当这般证明:

Xi={xR,Ti(x)=0}, 取θi0,θj=0,ji, 则

T(x),θ=0,xXiT(x),θ=const,

由定义知Xi的测度为0.

注: 本文还有一些别的identifiability的讨论, 这里不多赘述.

posted @   馒头and花卷  阅读(236)  评论(2编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示