标准正态分布表—R语言
正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布。高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
一、标准正态分布
标准正态分布是正态分布的标准化。正态分布是一个在数学,物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
1.1 正态分布
若随机变量\(X\)服从一个数学期望为\(\mu\)、方差为\(\sigma^2\)的正态分布,记为\(X∼N(\mu,{\sigma}^2)\),英文命名为Normal distribution,也就是典范规范分布。其概率密度函数为正态分布的期望值\(\mu\)决定了其位置,其标准差\(\sigma\)决定了分布的幅度,如下图所示。
它的密度函数为
该密度函数包含两个最重要的数学常量:自然对数的底数\(e\)和圆周率\(\pi\)。参数\(\mu,\sigma^2\)有明确的含义,分别是该分布的均值和方差。同时它的密度函数曲线如上图所示,被称为钟形曲线。
它的分布函数为
1.2 正态分布的性质
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。
1.3 标准正态分布
在正态分布函数中,当 \(\mu =0,\sigma =1\)时,就服从标准正态分布,标准正态分布概率密度函数为:
基于正态分布的对称性,当\(x\lt 0\)时,有
后面仅考虑\(x\gt 0\)的情形。
正态分布的标准化
正态分布可通过变换$$Z=\frac{X-\mu}{\sigma }$$化为标准正态分布。
正态分布的\(3\sigma\)区域
1.4 正态分布的上侧\(\alpha\)分位数
设X的密度函数为\(f(x)\),对于任给的\(\alpha\)(0<\(\alpha\)<1),称满足$$P(f(x)\ge Z_\alpha)$$的点\({Z_\alpha}\)为该分布函数的上侧\(\alpha\)分位数。
标准正态分布的上侧\(\alpha\)分位数\({Z_\alpha}\):
分位数中\(\alpha\)代表概率,\({Z_\alpha}\)代表随机变量值,\(\alpha\)其实是随机变量大于\({Z_\alpha}\)的概率。分位数可以查标准正态分布表,在正态分布表中找\(\alpha\),对应查出\({Z_\alpha}\)。
二、标准正态分布表
标准正态分布表就是分位数表,有的是下侧分位数表,有的是上侧分位数表,这里采用上侧分位数建表。
#计算上侧分位数的概率
options(digits = 6)
u=seq(0,3.09,by=0.01)
p=pnorm(u)
m=matrix(p,ncol=10,byrow=TRUE)
m1=1-m
plot(u,dnorm(u),lwd=2,col="blue")
#head(m1)
#编辑了表头,行名表示分位数小数点后一位前的所有数,列名表示分位数小数点后第二位的数值。
[0.00] [0.01] [0.01] [0.03] [0.04] [0.05] [0.06] [0.07] [0.08] [0.09]
[0.0] 0.500000 0.496011 0.492022 0.488034 0.484047 0.480061 0.476078 0.472097 0.468119 0.464144
[0.1] 0.460172 0.456205 0.452242 0.448283 0.444330 0.440382 0.436441 0.432505 0.428576 0.424655
[0.2] 0.420740 0.416834 0.412936 0.409046 0.405165 0.401294 0.397432 0.393580 0.389739 0.385908
[0.3] 0.382089 0.378280 0.374484 0.370700 0.366928 0.363169 0.359424 0.355691 0.351973 0.348268
[0.4] 0.344578 0.340903 0.337243 0.333598 0.329969 0.326355 0.322758 0.319178 0.315614 0.312067
[0.5] 0.308538 0.305026 0.301532 0.298056 0.294599 0.291160 0.287740 0.284339 0.280957 0.277595
[0.6] 0.274253 0.270931 0.267629 0.264347 0.261086 0.257846 0.254627 0.251429 0.248252 0.245097
[0.7] 0.241964 0.238852 0.235762 0.232695 0.229650 0.226627 0.223627 0.220650 0.217695 0.214764
[0.8] 0.211855 0.208970 0.206108 0.203269 0.200454 0.197663 0.194895 0.192150 0.189430 0.186733
[0.9] 0.184060 0.181411 0.178786 0.176186 0.173609 0.171056 0.168528 0.166023 0.163543 0.161087
[1.0] 0.158655 0.156248 0.153864 0.151505 0.149170 0.146859 0.144572 0.142310 0.140071 0.137857
[1.1] 0.135666 0.133500 0.131357 0.129238 0.127143 0.125072 0.123024 0.121000 0.119000 0.117023
[1.2] 0.115070 0.113139 0.111232 0.109349 0.107488 0.105650 0.103835 0.102042 0.100273 0.098525
[1.3] 0.096800 0.095098 0.093418 0.091759 0.090123 0.088508 0.086915 0.085343 0.083793 0.082264
[1.4] 0.080757 0.079270 0.077804 0.076359 0.074934 0.073529 0.072145 0.070781 0.069437 0.068112
[1.5] 0.066807 0.065522 0.064255 0.063008 0.061780 0.060571 0.059380 0.058208 0.057053 0.055917
[1.6] 0.054799 0.053699 0.052616 0.051551 0.050503 0.049471 0.048457 0.047460 0.046479 0.045514
[1.7] 0.044565 0.043633 0.042716 0.041815 0.040930 0.040059 0.039204 0.038364 0.037538 0.036727
[1.8] 0.035930 0.035148 0.034380 0.033625 0.032884 0.032157 0.031443 0.030742 0.030054 0.029379
[1.9] 0.028717 0.028067 0.027429 0.026803 0.026190 0.025588 0.024998 0.024419 0.023852 0.023295
[2.0] 0.022750 0.022216 0.021692 0.021178 0.020675 0.020182 0.019699 0.019226 0.018763 0.018309
[2.1] 0.017864 0.017429 0.017003 0.016586 0.016177 0.015778 0.015386 0.015003 0.014629 0.014262
[2.2] 0.013903 0.013553 0.013209 0.012874 0.012545 0.012224 0.011911 0.011604 0.011304 0.011011
[2.3] 0.010724 0.010444 0.010170 0.009903 0.009642 0.009387 0.009137 0.008894 0.008656 0.008424
[2.4] 0.008198 0.007976 0.007760 0.007549 0.007344 0.007143 0.006947 0.006756 0.006569 0.006387
[2.5] 0.006210 0.006037 0.005868 0.005703 0.005543 0.005386 0.005234 0.005085 0.004940 0.004799
[2.6] 0.004661 0.004527 0.004396 0.004269 0.004145 0.004025 0.003907 0.003793 0.003681 0.003573
[2.7] 0.003467 0.003364 0.003264 0.003167 0.003072 0.002980 0.002890 0.002803 0.002718 0.002635
[2.8] 0.002555 0.002477 0.002401 0.002327 0.002256 0.002186 0.002118 0.002052 0.001988 0.001926
[2.9] 0.001866 0.001807 0.001750 0.001695 0.001641 0.001589 0.001538 0.001489 0.001441 0.001395
[3.0] 0.001350 0.001306 0.001264 0.001223 0.001183 0.001144 0.001107 0.001070 0.001035 0.001001
例1: 查\(Z_{0.025}\)值,打开正态分布表,刚好能查到0.025对应的Z值为1.96,故\(Z_{0.025}\)=1.96;如果要查\(Z_{\alpha}\)=1.64对应的α值,那么打开正态分布表,可得\(\alpha\)=0.05(近似值或附近平均值)。
例2:查\(Z_{0.95}\)的值,可先查\(Z_{0.05}\),完了根据对称性转化即可,得\(Z_{0.95}\)=-1.64。
三、总结
作为统计学的基础,我们会主要注重思维理解,复杂的数学计算在此略去。这并非意味着数学不重要,对数学的仔细专研恰恰会特别辅助理解和掌握。正态分布在统计中是非常常用的分布,例如在医学上,可以应用正态分布估计人体的某些生理指标,比如白细胞数的正常值范围,白细胞数在正常人群中近似服从正态分布。可以制定一个上限和下限,比如95%的人在正常范围之内,而超出这一范围的人,我们就认为需要对其进行特殊关注。还要注意:正态分布并不普适,有许多数据与正态拟合不好的情况,但我们仍可以利用其一些性质对数据进行一定的估计,以应对生产生活需要。在科研数据处理中要有选择性的择合适的方法(如其t分布等)进行检验;在数据处理时,正态分布也可以通过标准化处理,转化为标准正态分布。使用z=(X-μ)/σ将原始数据转化为标准分数。