【转载】高斯概率密度函数

1.单变量正态分布

单变量正态分布概率密度函数定义为： $\Large{p(x) = \frac{1}{{\sqrt {2\pi } \sigma }}{e^{ - \frac{1}{2}{{(\frac{{x - \mu }}{\sigma })}^2}}}}$

其中， $σ^{2}$

$μ = E (x) = \int_{- \infty}^{\infty} x p (x) d x$

$σ^{2} = \int_{- \infty}^{\infty} {(x - μ)}^{2} p (x) d x$

$matlab绘制正态分布曲线：$

% 绘制单变量正态分布概率密度曲线
x1=-5:0.01:5; % 注意取值的对称性
subplot(2,1,1) % subplot(m,n,p):m和n代表在一个图像窗口中显示m行n列个图像，p代表现在选定第p个图像区域
% normpdf:正态概率密度函数。Y=normpdf(X,mu,sigma),mu:均值,sigma:标准差,Y:正态概率密度函数在x处的值
y1=normpdf(x1,0,1);
plot(x1,y1,'r');
title('\mu=0,\sigma^2=1')
xlabel('x')
ylabel('\rho(x)')
subplot(2,1,2)
x2=-5:0.01:7; % 注意取值的对称性
y2=normpdf(x2,1,sqrt(0.2));
plot(x2,y2,'r');
title('\mu=1,\sigma^2=0.2')
xlabel('x')
ylabel('\rho(x)')

可视化：

由图中可知，方差越大曲线越宽，曲线始终以 $\mu$ 为中心

2.多元正态分布

（1）多元正态分布的概率密度函数的定义为：

$p (x) = \frac{1}{{(2 π)}^{d / 2} | \sum |^{1 / 2}} \exp [- \frac{1}{2} (x - μ)^{T} \sum^{- 1} (x - μ)]$

式中： $x = {[{x_1},{x_2}, \ldots ,{x_d}]^T}$ 是d维列向量； $\mu = {[{\mu _1},{\mu _2}, \ldots ,{\mu _d}]^T}$ 是d维均值向量； $\sum$ 是d x d维协方差矩阵， ${\sum ^{ - 1}}$ 是 $\sum$ 的逆矩阵， ${|\sum |}$ 是 $\sum$ 的行列式。

定义 $\sum$ 为：

$\Large\sum {\rm{ = E}}[(x - \mu ){(x - \mu )^T}]$

显然，d=1时，多变量高斯与单变量高斯一致。有时用符号 $N(\mu ,\sum )$ 表示均值为 $\mu$ 、协方差为 $\sum$ 的高斯概率密度函数。

为了更好地理解什么是多变量高斯，我们考虑在二维空间的一些情况，二维空间是可视的。在这种情况下，有：

$\Large \sum = \left( {\begin{array}{*{20}{c}} {{\sigma _1}^2}&{{\sigma _{12}}}\\ {{\sigma _{21}}}&{{\sigma _2}^2} \end{array}} \right)$

其中 $(x - \mu )$ 为2×1的列向量， ${(x - \mu )^T}$ 为1的行向量。对于每个 ${\mu _i}$ 有 $E({x_i}) = {\mu _i},i = 1,2$ ，通过定义 ${\sigma _{12}} = E[({x_1} - {\mu _1})({x_2} - {\mu _2})]$ ，得到随机变量 ${x_1}$ 和 ${x_2}$ 的协方差，这个可以度量它们的相互统计相关性。在统计意义下，如果变量是独立的，其协方差为0。显然， $\sum$ 对角元素是随机向量中各个元素的方差。

2.二维高斯概率密度函数的示例

代码：

% 绘制双变量正态分布概率密度曲线
x = 1 : 0.3 : 7;
y = 1 : 0.3 : 7;
% 生成网络矩阵
[X,Y]=meshgrid(x,y);
U1 = 4.0; % X的均值
DX = 1; % X的方差
dx = sqrt(DX);
U2 = 3.8; % Y的均值
DY = 1; % Y的方差
dy = sqrt(DY)
COV = 0; % X Y的协方差
% X和Y的相关系数
r = COV / (dx * dy);
part1 = 1 / (2 * pi * dx * dy * sqrt(1-r^2));
p1 =  -1 / (2 * (1 - r^2));
px = (X-U1).^2 ./ DX;
py = (Y-U2).^2 ./ DY;
pxy = 2 * r .* (X-U1) .* (Y-U2) ./ (dx * dy);
Z = part1 * exp(p1 * (px - pxy + py));
figure(1)
mesh(X,Y,Z)
xlabel('x1');
ylabel('x2');
zlabel('\rho(x)');
title('二维概率密度曲线');
figure(2);
mesh(X,Y,Z);
xlabel('x1');
ylabel('x2');
zlabel('\rho(x)');
title('等值曲线');
% 设置视点的函数
view(0,90);

3.1 ${\sigma _1}^2 = {\sigma _2}^2$

二维概率密度函数曲线：

等值曲线：

3.2 ${\sigma _1}^2 >> {\sigma _2}^2$

(DX=16,DY=4)

二维概率密度函数曲线：

等值曲线：

此时等值曲线呈现向x1方向延伸状。

3.3 ${\sigma _2}^2 > > {\sigma _1}^2$

(DX=4,DY=16)

二维概率密度函数曲线：

等值曲线：

此时等值曲线呈现向x2方向延申状。

3.4 ${\sigma _{12}} \ne 0$

(U1 = 4.0,DX = 16,U2 = 3.8,DY = 4,COV = 4)

二维概率密度函数曲线：

等值曲线：

由于改变 ${\sigma _1}^2,{\sigma _2}^2,{\sigma _{12}}$ 的值就可以得到不同的形状和方向。
等值曲线是不同方向、与短轴长度成不同比例的椭圆。考虑对角线协方差矩阵的随机向量的均值为0，即 ${\mu _1} = 0,{\mu _2} = 0$ ，即有如下方程：（计算等值曲线相当于计算指数为常数 $C$ 的曲线）