【转载】高斯概率密度函数

1.单变量正态分布

单变量正态分布概率密度函数定义为:\[\Large{p(x) = \frac{1}{{\sqrt {2\pi } \sigma }}{e^{ - \frac{1}{2}{{(\frac{{x - \mu }}{\sigma })}^2}}}}\]

其中,μ为随机变量x的期望,${\sigma ^2}$为x的方差,${\sigma}$为x的标准差。

\[\Large\mu  = E(x) = \int_{ - \infty }^\infty  {xp(x)dx} \]

\[\Large{\sigma ^2} = \int_{ - \infty }^\infty  {{{(x - \mu )}^2}} p(x)dx\]

 

matlab绘制正态分布曲线:

% 绘制单变量正态分布概率密度曲线
x1=-5:0.01:5; % 注意取值的对称性
subplot(2,1,1) % subplot(m,n,p):m和n代表在一个图像窗口中显示m行n列个图像,p代表现在选定第p个图像区域
% normpdf:正态概率密度函数。Y=normpdf(X,mu,sigma),mu:均值,sigma:标准差,Y:正态概率密度函数在x处的值
y1=normpdf(x1,0,1);
plot(x1,y1,'r');
title('\mu=0,\sigma^2=1')
xlabel('x')
ylabel('\rho(x)')
subplot(2,1,2)
x2=-5:0.01:7; % 注意取值的对称性
y2=normpdf(x2,1,sqrt(0.2));
plot(x2,y2,'r');
title('\mu=1,\sigma^2=0.2')
xlabel('x')
ylabel('\rho(x)')

 可视化:

由图中可知,方差越大曲线越宽,曲线始终以$\mu $为中心

2.多元正态分布

(1)多元正态分布的概率密度函数的定义为:

\[\Large p(x) = \frac{1}{{{{(2\pi )}^{d/2}}|\sum {|^{1/2}}}}\exp [ - \frac{1}{2}{(x - \mu )^T}{\sum ^{ - 1}}(x - \mu )]\]

式中:$x = {[{x_1},{x_2}, \ldots ,{x_d}]^T}$是d维列向量;$\mu  = {[{\mu _1},{\mu _2}, \ldots ,{\mu _d}]^T}$是d维均值向量;$\sum $是d x d维协方差矩阵,${\sum ^{ - 1}}$是$\sum $的逆矩阵,${|\sum |}$是$\sum $的行列式。

定义$\sum $为:

\[\Large\sum {\rm{ = E}}[(x - \mu ){(x - \mu )^T}]\]

显然,d=1时,多变量高斯与单变量高斯一致。有时用符号$N(\mu ,\sum )$表示均值为$\mu$、协方差为$\sum $的高斯概率密度函数。

为了更好地理解什么是多变量高斯,我们考虑在二维空间的一些情况,二维空间是可视的。在这种情况下,有:

\[\Large \sum  = \left( {\begin{array}{*{20}{c}}
{{\sigma _1}^2}&{{\sigma _{12}}}\\
{{\sigma _{21}}}&{{\sigma _2}^2}
\end{array}} \right)\]

其中$(x - \mu )$为2×1的列向量,${(x - \mu )^T}$为1×2的行向量。对于每个${\mu _i}$有$E({x_i}) = {\mu _i},i = 1,2$,通过定义${\sigma _{12}} = E[({x_1} - {\mu _1})({x_2} - {\mu _2})]$,得到随机变量${x_1}$和${x_2}$的协方差,这个可以度量它们的相互统计相关性。在统计意义下,如果变量是独立的,其协方差为0。显然,$\sum $对角元素是随机向量中各个元素的方差。

2.二维高斯概率密度函数的示例

 代码:

% 绘制双变量正态分布概率密度曲线
x = 1 : 0.3 : 7;
y = 1 : 0.3 : 7;
% 生成网络矩阵
[X,Y]=meshgrid(x,y);
U1 = 4.0; % X的均值
DX = 1; % X的方差
dx = sqrt(DX);
U2 = 3.8; % Y的均值
DY = 1; % Y的方差
dy = sqrt(DY)
COV = 0; % X Y的协方差
% X和Y的相关系数
r = COV / (dx * dy);
part1 = 1 / (2 * pi * dx * dy * sqrt(1-r^2));
p1 =  -1 / (2 * (1 - r^2));
px = (X-U1).^2 ./ DX;
py = (Y-U2).^2 ./ DY;
pxy = 2 * r .* (X-U1) .* (Y-U2) ./ (dx * dy);
Z = part1 * exp(p1 * (px - pxy + py));
figure(1)
mesh(X,Y,Z)
xlabel('x1');
ylabel('x2');
zlabel('\rho(x)');
title('二维概率密度曲线');
figure(2);
mesh(X,Y,Z);
xlabel('x1');
ylabel('x2');
zlabel('\rho(x)');
title('等值曲线');
% 设置视点的函数
view(0,90);

 3.1 ${\sigma _1}^2 = {\sigma _2}^2$

 

二维概率密度函数曲线

等值曲线

 

 3.2 ${\sigma _1}^2  >>  {\sigma _2}^2$

(DX=16,DY=4)

二维概率密度函数曲线

等值曲线

 

此时等值曲线呈现向x1方向延伸状。

3.3 ${\sigma _2}^2 >  > {\sigma _1}^2$

(DX=4,DY=16)

二维概率密度函数曲线

等值曲线

此时等值曲线呈现向x2​方向延申状。

3.4 ${\sigma _{12}} \ne 0$

(U1 = 4.0,DX = 16,U2 = 3.8,DY = 4,COV = 4)

二维概率密度函数曲线

 

等值曲线

 


由于改变 ${\sigma _1}^2,{\sigma _2}^2,{\sigma _{12}}$​的值就可以得到不同的形状和方向。
等值曲线是不同方向、与短轴长度成不同比例的椭圆。考虑对角线协方差矩阵的随机向量的均值为0,即${\mu _1} = 0,{\mu _2} = 0$,即有如下方程:(计算等值曲线相当于计算指数为常数$C$的曲线)

\[\frac{{{x_1}^2}}{{{\sigma _1}^2}} + \frac{{{x_2}^2}}{{{\sigma _2}^2}} = C\]

 

附:

二维高斯分布计算公式:

 

原文链接:https://blog.csdn.net/linjing_zyq/article/details/120364622

参考:https://baike.baidu.com/item/%E4%BA%8C%E7%BB%B4%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83/2951835?fr=aladdin

 

posted @ 2021-11-28 19:11  One7  阅读(5071)  评论(0编辑  收藏  举报