指数族分布:相关概念理解
一、指数族分布指的是概率密度函数都能够表述成以下形式的概率分布。
其中fai(x)是充分统计量,A(ita)是对数配分函数。ita是规范化参数。【配分函数其实就是归一化因子的概念,为了使概率满足概率总和为1的约束】
指数族分布包括Gauss分布,bernoulli分布(0,1分布),beta分布,gamma分布,二项分布(多项式分布),Dirichlet分布等。这些分布的概率密度函数都可以表示成上图中式子的形式。
对数配分函数的推导
举例将高斯分布的概率密度函数用指数族分布的形式表达如下:
三、指数族分布有三个重要性质,分别是充分统计量、共轭、最大熵。
①关于充分统计量:(sufficient statistic)的理解:比如高斯分布中的{均值、方差}就是一组充分统计量,通过{均值,方差}我们就能得到这一组数据的大部分信息。(待确定)
不仅是{均值,方差},也可以是{sum(xi),sum(xi)^2}...,【查找相关统计概念】
充分统计量“充分”指的就是参数组{ ..}包含的原始数据的信息足够多,可以用于压缩数据。
“统计量”指的就是数学意义上一组数据的统计量,比如均值,方差...。
②关于共轭:是通过似然和先验的共轭关系,将先验的分布与后验的分布联系起来。如果似然和先验共轭,那么后验的分布与先验的分布是同一种分布。
③关于最大熵:【待定:对未知参数的估计,往最随机的方向假定。】
四、指数族分布中A(ita)和fai(x)的关系、A'(ita)和fai(x)的关系
①:A'(ita)和fai(x)的关系
式①:配分函数Z(也叫作归一化因子)
A'(ita)和fai(x)的关系: A'(ita)=E(fai(x)),条件是p(x|ita)。
②由极大似然的想法推出 g_MLE=1/N(sum(fai(xi)))。
即从样本的充分统计量进行求和平均,就能得到参数向量值 g_mle。
可以应用于广义线性模型(回归/分类)、概率图模型(RBM)、和变分推断(简便运算)中。
参考:
1.https://www.bilibili.com/video/BV1QW411y7D3?p=2,B站UP主:shuhuai008