Exponential family of distributions

Choi H. I. Lecture 4: Exponential family of distributions and generalized linear model (GLM).

定义

定义: 一个分布具有如下形式的密度函数:

fθ(x)=1Z(θ)h(x)eT(x),θ,

则该分布属于指数族分布.
其中xRm, T(x)=(T1(x),T2(x),,Tk(x))Rk, θ=(θ1,θ2,,θk)为未知参数, Z(θ)=h(x)eT(x),θdx为配平常数.

若令C(x)=logh(x), A(θ)=logZ(θ), 则

fθ(x)=exp(T(x),θA(θ)+C(x)).

指数族分布还有一种更一般的形式:

fθ(x)=exp(T(x),θA(θ)ϕ+C(x,ϕ)),

更甚者

fθ(x)=exp(T(x),λ(θ)A(θ)ϕ+C(x,ϕ)),

ϕ控制分布的形状.

性质

A(θ)

Proposition 1:

θA(θ)=fθ(x)T(x)dx=E[T(X)].

proof:

已知:

fθ(x)dx=exp(T(x),θA(θ)ϕ+C(x,ϕ))dx=1.

两边关于θ求梯度得:

fθ(x)T(x)θA(θ)ϕdx=0θA(θ)=E[T(X)].

Proposition 2:

Dθ2A=(2Aθiθj)=1ϕCov(T(X),T(X))=1ϕCov(T(X)).

proof:

Aθi=exp(T(x),θA(θ)ϕ+C(x,ϕ))Ti(x)dx.

2Aθiθj=fθ(x)Tj(x)AθjϕTi(x)dx=1ϕfθ(x)(Tj(x)Aθj)(Ti(x)Aθi)dx=Cov(Ti(X),Tj(X)).

Corollary 1: A(θ)关于θ是凸函数.

既然其黑塞矩阵半正定.

极大似然估计

设有{xi}i=1n个样本, 则对数似然函数为

l(θ)=1θ[θ,i=1nT(xi)nA(θ)]+i=1nC(xi,ϕ),

因为A(θ)是凸函数, 所以上述存在最小值点, 且

θl(θ)=1ϕ[i=1nT(xi)nθA(θ)],

故该最小值点在

θA(θ)=1ni=1nT(xi),

处达到.

最大熵

最大熵原理-科学空间

指数族分布实际上满足最大熵分布, 这是在没有任何偏爱的尺度下的分布.

maxfH(f)=f(x)logf(x)dx.

等价于最小化

minff(x)logf(x)dx.

往往, 我们会有一些已知的统计信息, 通常以期望的形式表示:

f(x)hi(x)dx=ci,i=1,2,s.

则我们的目标实际上是:

minff(x)logf(x)dxs.t.f(x)hi(x)dx=ci,i=0,2,s.

其中h0=1,c0=1, 即密度函数需满足f(x)dx=1.

利用拉格朗日乘数得:

J(f,λ)=f(x)logf(x)dx+λ0(1f(x)dx)+i=1sλi[cif(x)hi(x)dx].

最优条件, J关于f的变分为0, 即

1+logf(x)λ0i=1sλihi(x)=0.

f(x)=1Zexp(i=1sλihi(x)).

属于指数分布族.

例子

Bernoulli

P(x)=px(1p)1x=exp[xlogp1p+log(1p)].

θ=logp1p,T(x)=x,A(θ)=log(1+eθ),h(x)=0.

指数分布

p(x)=λeλx=exp[λx+logλ],x0.

θ=λ,T(x)=x,A(θ)=log1λ,h(x)=I(x0).

正态分布

p(x)=12πσ2exp[(xμ)22σ2].

σ视作已知参数:

p(x)=exp[12x2+xμ12μ2σ212log(2πσ2)].

θ=(μ,1),T(x)=(x,12x2),ϕ=σ2,A(θ)=12μ2,C(x,ϕ)=12log(2πσ2).

σ视作未知参数:

p(x)=exp[12σ2y2+μσ2x12σ2μ2logσ12log2π].

T(x)=(x,12x2),θ=(μσ2,1σ2),A(θ)=μ22σ2+logσ,C(x)=12log(2π).

posted @   馒头and花卷  阅读(86)  评论(0编辑  收藏  举报
编辑推荐:
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示