二项分布,柏松分布和正态分布
主要介绍以下三种相互关联的概率分布:
离散型随机变量的概率分布:二项分布,柏松分布
连续性随机变量的概率分布:正态分布。
一,二项分布
满足条件:
1)每次试验中事件只有两种结果:事件发生或者不发生,如硬币正面或反面,患病或没患病;
2)每次试验中事件发生的概率是相同的,每次抛硬币正面和反面的概率都为0.5;每次投篮命中率都为0.6等等。
3)n次试验的事件相互之间独立。
特征:
1,当p较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称。
2,当p约等于1-p,且n趋近于无穷大时,二项分布的极限分布为正态分布。当p很小,且n很大时,二项分布的极限分布为柏松分布
概率分布函数为:
也为:
若随机变量满x(或者k)=0,1,2,3,....满足该分布函数,则称随机变量x(或者k)服从参数为n和p的二项分布,记为:x(k)~B(n, p)。
应用:判断n次独立重复事件中成功或者失败次数为k的概率,其中成功的概率为p,失败的概率为1-p。
二,柏松分布
由二项分布推导而来。柏松分布是二项分布的极限情况,即二项分布的伯努利试验中,如果试验次数n很大,二项分布的概率p很小,且乘积λ= np比较适中,则事件出现的次数的概率可以用泊松分布来逼近。
推导例子:如下图,
满足条件:
a, 事件发生为小概率事件
b, 事件独立发生
c, 事件发生的概率稳定
特征:
1,柏松分布的一大特征为 平均数等于方差等于lamda,即 。
2,是柏松分布的唯一参数,当大于等于20时,接近于正态分布,可以用正态分布来处理柏松分布问题。
概率分布函数为:
若随机变量满x(或者k)=0,1,2,3,....满足该分布函数,则称随机变量x(或者k)服从参数为的柏松分布,记为:x(k)~P()。
应用:观察事物平均发生次的条件下,实际发生k次的概率P。
三,正态分布
正态分布是一种重要的连续随机变量的概率分布。中心极限定理表明,在观测数据非常大的时候,具有独立分布的独立随机变量的观测样本的平均值是收敛于正态分布的。
不少随机变量的概率分布在一定条件下以正太分布为极限分布,如二项分布和柏松分布(见上文)。
满足条件:
随机变量受到若干独立因素共同影响,且每个因素不能产生支配性的作用。
特征:
1,正态分布是关于x = μ对称的。
2,正态分布曲线有两个拐点,分别在离均值一个标准差的位置,为x=μ-σ和x=μ+σ。
3,对于任意的正态偏差X,Z = ( X - μ ) / σ是一个标准正态偏差。
4,对于特定的期望值和方差,正态分布是具有最大熵的连续分布。
5,由于对于离期望值好几个标准差范围之外的取值,它们的概率趋近于0。
6,正态分布概率的覆盖范围遵循68-95-99.7的规定,这个规定又称为3-sigma规定。也就是说在距离均值一个标准差的范围内的取值的概率大概是68%,在两个标准差范围大概是95,在三个标准差范围大概是99.7%。
概率分布函数为:
应用: