高数笔记之二项分布, 柏松分布, 正态分布

0x00 概述

主要介绍以下三种相互关联的概率分布:

# 离散型随机变量的概率分布:二项分布,柏松分布

# 连续性随机变量的概率分布:正态分布。

 

0x01 二项分布

满足条件:

'''
1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病;

2)每次试验中事件发生的概率是相同的,每次抛硬币正面和反面的概率都为0.5;每次投篮命中率都为0.6等等。

3)n次试验的事件相互之间独立。
'''

特征:

'''
1,当p较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称。

2,当p约等于1-p,且n趋近于无穷大时,二项分布的极限分布为正态分布。当p很小,且n很大时,二项分布的极限分布为柏松分布
'''

概率分布函数为:

也为

若随机变量满x(或者k)=0,1,2,3,....满足该分布函数,则称随机变量x(或者k)服从参数为n和p的二项分布,记为:x(k)~B(n, p)。

'''
应用:判断n次独立重复事件中成功或者失败次数为k的概率,其中成功的概率为p,失败的概率为1-p。
'''

 

0x02 柏松分布

由二项分布推导而来。柏松分布是二项分布的极限情况,即二项分布的伯努利试验中,如果试验次数n很大,二项分布的概率p很小,且乘积λ= np比较适中,则事件出现的次数的概率可以用泊松分布来逼近。

推导例子:如下图,

满足条件:

'''
a, 事件发生为小概率事件

b, 事件独立发生

c, 事件发生的概率稳定
'''

特征:

1,柏松分布的一大特征为平均数等于方差等于lamda,即 。 

2,是柏松分布的唯一参数,当大于等于20时,接近于正态分布,可以用正态分布来处理柏松分布问题。

概率分布函数为:

若随机变量满x(或者k)=0,1,2,3,....满足该分布函数,则称随机变量x(或者k)服从参数为lamda的柏松分布,记为:x(k)~P()。

'''
应用:观察事物平均发生次的条件下,实际发生k次的概率P。
'''

 

0x03 正态分布

正态分布是一种重要的连续随机变量的概率分布。中心极限定理表明,在观测数据非常大的时候,具有独立分布的独立随机变量的观测样本的平均值是收敛于正态分布的。

不少随机变量的概率分布在一定条件下以正太分布为极限分布,如二项分布和柏松分布(见上文)。

满足条件:

'''
随机变量受到若干独立因素共同影响,且每个因素不能产生支配性的作用。
'''

特征:

'''
1,正态分布是关于x = μ对称的。

2,正态分布曲线有两个拐点,分别在离均值一个标准差的位置,为x=μ-σ和x=μ+σ。

3,对于任意的正态偏差X,Z = ( X - μ ) / σ是一个标准正态偏差。

4,对于特定的期望值和方差,正态分布是具有最大熵的连续分布。

5,由于对于离期望值好几个标准差范围之外的取值,它们的概率趋近于0。

6,正态分布概率的覆盖范围遵循68-95-99.7的规定,这个规定又称为3-sigma规定。也就是说在距离均值一个标准差的范围内的取值的概率大概是68%,在两个标准差范围大概是95,在三个标准差范围大概是99.7%。 
'''

概率分布函数为:

应用:

'''
⒈ 估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。 
⒉ 制定参考值范围
    ⑴正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。
    ⑵百分位数法 常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。
⒊ 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。
⒋ 正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。
'''

 

0x04 转载

 

posted @ 2021-01-25 16:10  时光飞逝,逝者如斯  阅读(1400)  评论(0编辑  收藏  举报