数学之路(3)-数据分析(6)
本博客所有内容是原创,未经书面许可,严禁任何形式的转载。
http://blog.csdn.net/u010255642
我们可以做一个累积分布概率的散点图
> plot(x,pnorm(x,mymean,mysd))
>
一个连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值在某一个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则是概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。
正态分布的概率密度函数为:
使用dnorm(变量,平均值,标准差)计算概率密度函数
> dnorm(x,mymean,mysd)
[1] 1.184240e-04 8.009886e-05 1.184240e-04 2.358477e-04 3.070239e-04
[6] 3.202882e-04 3.336542e-04 2.910430e-04 3.359337e-04 3.321435e-04
[11] 1.444115e-04 1.733374e-04 2.463862e-04 3.120546e-04 3.225207e-04
[16] 8.307503e-05
>
查看均值
> mymean
[1] 6014.875
>
然后做散点图,可以看到该曲线接近于6014.875对称分布
>plot(x,dnorm(x,mymean,mysd))