PRML-2.4 指数族分布

1.指数族分布的标准形式

p(x|η)=h(x)g(η)exp{ηTu(x)}
B
p(x|η)=h(x)exp{ηTϕ(x)A(η)}
u(x)=ϕ(x),g(η)=1exp{A(η)}
ηT,u(x)=ϕ(x),A(η)log partition function,加上对数的配分函数和归一化相关

2.正态分布转化为指数族分布的标准形式

PRML书上还展示了一个伯努利分布转为指数族分布的例子,这里介绍正态分布的转化例子,B站白板推导也有这部分
p(x|μ,σ2)=12πσ2exp{12σ2(xμ)2}
转化为指数族分布形式
η=(η1η2)=(μ12σ2)
u(x)=ϕ(x)=(xx2)
g(η)=(2η2)12exp(η122η2)

2.指数族分布的性质

2.1对η进行最大似然估计

指数族分布的标准形式
p(x|η)=h(x)g(η)exp{ηTu(x)}
因为是pdf函数,所有积分=1
xp(x|η)=xh(x)g(η)exp{ηTu(x)}dx=g(η)xh(x)exp{ηTu(x)}dx=1
式子
g(η)xh(x)exp{ηTu(x)}dxη求导=0 求最大η,
g(η)h(x)exp{ηTμ(x)}dx+g(η)h(x)exp{ηTμ(x)}μ(x)dx=0
g(η)xh(x)exp{ηTu(x)}dx=1
1gηg(η)=g(η)h(x)exp{ηTμ(x)}μ(x)dx=E[u(x)]
lng(η)=E[u(x)]
u(x)η

这是B站的推导

二阶导是方差,方差>0,所有A是个凸函数


ηX={x1,x2,...,XN},ηη,,ηu(x)()η
ηMLE,ηMLEη

B站对最大似然函数的推导

2.2 共轭先验

关于共轭先验的知识本博客其他章节已经详述,这里不再重复了
共轭先验的优点是先验和后验是同一个分布(对于某个统计量而言),通过假设一个和后验一样的先验可以计算方便,但是这个假设有点强

2.3 最大熵的角度看指数族分布

B站的这一章节,第一个视频不详述了,一个简单的结论,熵最大的分布是均匀分布
第二个视频对最大熵模型做了推导
这是最大熵模型对应的优化问题,是一个有约束的优化问题,Δ代表是一个常数,要求最大熵模型的均值和经验分布的均值是一致的


然后解这个最优化问题

最后结论,在最大熵模型下,使得熵最大的分布是指数族分布,刚一看有点惊讶,但其实PRML书中已经有了相关说明,在P43,公式1.109下面
最大化微分熵的分布是高斯分布

3.指数族分布的应用场景

广义线性模型
--线性组合 wTx
--link function这是激活函数的反函数
--指数族分布:y|x,线y|xN,y|x
概率图模型
--无向图:RBM
变分推断
--如果是指数族分布,可以简化变分推断

posted @   筷点雪糕侠  阅读(298)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示