Python中np.random.multivariate_normal问题

首先看一下一维正态分布的公式:

 

 其中μ为均值,σ为标准差,正态分布的草图如下图所示。

 

 再看numpy提供的函数的参数:

multivariate_normal(mean,cov,size=None,check_valid=None,tol=None)

在一维正态分布中,第一个参数mean就是这里的均值μ,第二个参数cov就是方差【公式cov(x,x)=D(x)】,第三个参数size就是生成的正态分布矩阵的维度。

如下图,均值设置为3,方差为1,然后取100个点生成一维矩阵Y来绘制散点图,打印出的方差接近设定的值1.

import numpy as np
import matplotlib.pyplot as plt
mean = np.array([3])
cov = np.eye(1)
dot_num = 100
Y = np.random.multivariate_normal(mean,cov,dot_num)
X = np.linspace(0,dot_num-1,dot_num)
plt.scatter(X,Y,c = 'r',marker = '+')
plt.show()
print(np.var(Y))

打印出结果如下:

 

 可以看到散点图如下,图中可以看出,100个散点的均值大致是3(看Y轴)

 

 再看二维正态分布的公式:

 

 这里μ1,μ2分别为变量X,Y的均值;σ1,σ2分别为变量X,Y的标准差,草图如下。

 

 再看协方差的定义,以及协方差与期望值的关系

 函数multivariate_normal(mean,cov,size = None,check_valid = None,tol =None)在二维正态分布中,mean是变量X和Y的均值,它的维度为一维。

cov是一个协方差矩阵,它的组成如下,在tensorflow中一般设置cov(x,y)=cov(y,x)=0

 

 

 size表示生成的正态分布矩阵的维度,如size维度为(1,3,2),那么生成的正态分布矩阵维度为:1*3*2*len(mean)

其他几个参数见链接

链接:https://blog.csdn.net/xc_zhou/article/details/86701549

接着设置mean = [3,0],cov = diag(1,1),使用300个点绘制散点图,打印出X和Y的方差均接近于设定的值1

import numpy as np
import matplotlib.pyplot as plt
mean = np.array([3,0])
cov = np.eye(2) #协方差cov(X,Y)=0,方差D(X)=D(Y)=1
dot_num = 300

#len(mean) = 2,因此生成的正态矩阵维度为dot_num*len(mean)=300*2

f_xy = np.random.multivariate_normal(mean,cov,dot_num)

print(f_xy.shape)

print(np.var(f_xy[:,0]),np.var(f_xy[:,1]))

plt.scatter(f_xy[:,0],f_xy[:,1],c='r')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()

 

可以看到散点图中,X和Y均值大致上分别是3和0

 可依次类推至多维正态分布中。

 

posted @ 2021-07-02 16:22  阿井井w  阅读(984)  评论(0编辑  收藏  举报