理解多维高斯分布

理解多维高斯分布

前言

在数理统计和机器学习中,经常用到高斯分布,这里根据网上的资源和理解,对多维高斯分布做一个小总结。

如有谬误,请联系指正。转载请注明出处。

联系方式:
e-mail: FesianXu@163.com
QQ: 973926198
github: https://github.com/FesianXu


一维高斯分布

标准的一维高斯分布是0均值和单位方差的,数学形式如(1):

(1)p(x)=12πexp(x22)

为了扩展成一般的一维高斯分布,我们引入一个线性变换x:=A(xμ),结合(1),有:
(2)(5)p(x)=|A|2πexp(A2(xμ)22)

σ=1/A,式(2)变为:
(3)p(x)=1σ2πexp((xμ)22σ2)

从这里可以看出Aσ存在关系。在系数前乘上|A|是为了整个分布的积分为1。这里的||表示绝对值,在多变量下,则表示行列式。

在一维高斯分布上,通过调整均值μ和方差σ2可以调整分布的形状,使得其向左右平移,或者拉伸其”顶峰”。

这里写图片描述

多维高斯分布

多维高斯分布其变量为n维变量,每个变量之间可能会存在关系,为了描述这种关系,我们引入了协方差矩阵Σ,其大小为n×n,其中每一个元素为:

(4)(2)Σi,j=conv(Xi,Xj)(3)=E(XiXj)E(Xi)E(Ej)

我们首先看看标准二维高斯分布的数学表达式(5),因为是标准二维高斯分布,所以每个变量之间是独立的:
(5)p(x,y)=p(x)p(y)=12πexp(x2+y22)

为了向量化公式,用向量v=[x  y]T,有:
(6)p(v)=12πexp(12vTv)

这个时候,用v=A(xμ),其中的Av中每个分量的线性组合系数,也就是说A表示了每个变量的线性关系。有:
(7)p(v)=|A|2πexp(12(xμ)TATA(xμ))

Σ=(ATA)1表示其协方差,其中|A|为行列式,有:
(8)p(v)=12π|Σ|1/2exp(12(xμ)TΣ1(xμ))

当维度大于2时,情形类似,n维的高斯分布公式为:
(9)p(v)=1(2π)n/2|Σ|1/2exp(12(xμ)TΣ1(xμ))vRn

多维高斯分布的图像性质

这里写图片描述
以上三个图形的期望都为:μ=[0,0]T,最左端图形的协方差Σ=I,中间的Σ=0.6I,最右端的Σ=2I,我们可以看出:当变小时,图像变得更加“瘦长”,而当增大时,图像变得更加“扁平”。

这里写图片描述

Reference

  1. 斯坦福大学机器学习——高斯判别分析
  2. 多维高斯分布是如何由一维发展而来的?
posted @ 2018-05-16 16:40  FesianXu  阅读(342)  评论(0编辑  收藏  举报