一维随机变量及其概率分布
1. 随机变量的概念
顾名思义,随机变量就是“其值随机会而定”的变量。随机变量的反面是“确定性变量”,即其值遵循某种严格的规律的变量,比如从北京到上海的距离。但是从绝对意义上讲,许多通常视为确定性变量的量,本质上都有随机性,只是由于随机性干扰不大,以至在所要求的精度之内,不妨把经作为确定性变量来处理。
根据随机变量其可能取的值的全体的性质,可以把随机变量分为2大类,一类是离散型随机变量,比如检验100件产品中的次品个数;一类是连续型随机变量,比如一个灯泡的寿命。但是连续型变量这个概念只是数学上的抽象,因为任何量都有单位,都只能在该单位下量到一定的精度,所以也一定是离散的,比如灯泡的寿命如果只精确到秒,那它的寿命也是可以离散表示的。
研究随机变量的根本原因是,我们需要研究一些事物身上表现出来的会变动的因子,这些因子的值随机而定,但可能存在某种规律(比如总是取到某些特殊的值),我们需要研究这些规律(比如分布规律),而对这些因子做预测。
2. 离散型随机变量的分布
我们研究随机变量,并不是只关心它能取到哪些值,往往也关心的是它取到某些值的频率如何,即取到该值的概率。这个特性,我们称之为分布。
定义2.1
设XX 为离散型随机变量,其全部的可能值为{a1,a2,…}{a1,a2,…} ,则
称为XX 的概率函数。且有下面的性质:
XX 的概率函数给出了:全部概率1是如何在其可能的值之间分配的,所以也把它称为随机变量XX 的“概率分布”。 因为离散型的随机变量的概率分布通常以一个表的形式给出,所以有时把它称为XX 的分布表。
定义2.2
设XX 为一随机变量,则函数
称为XX 的分布函数。
对离散型随机变量而言,概率函数与分布函数在下述意义下是等价的。
由pipi 求F(x)F(x) 是显然的,而由F(x)F(x) 求pipi ,只需注意:
对于任何随机变量XX ,其分布函数F(x)F(x) 具有下面的一般性质:
1)F(x)F(x) 是单降非降的:当(x1<x2)(x1<x2) 时,有F(x1)≤F(x2)F(x1)≤F(x2) ;
2)当x→∞x→∞ 时,F(x)→1F(x)→1 ;当x→–∞x→–∞ 时,F(x)→0F(x)→0 ;
研究分布函数的直接原因是可以根据分布函数求概率,另一个原因我觉得是针对于连续型随机变量,因为它研究取某个值的概率没有意义,所以更多的关心的一个范围,比哪灯光寿命1万小时-1.2万小时的可能性大小,像这样范围内的概率用分布函数更容易求得。
3. 几个常见的离散型分布
3.1. 二项分布
某事件AA 在一次试验中发生的概率为pp 。现在把这个试验独立重复nn 次,以XX 记AA 在这nn 次试验中发生的次数,则nn 可能的取值为0,1,…,n0,1,…,n ,我们称随机变量XX 服从二项分布,记为:X∼B(n,p)X∼B(n,p) ,同时这种试验称为伯努利试验。
X=kX=k 表示nn 次试验中,事件AA 恰好发生了kk 次,那么一共有(nk)(nk) 种途径,而且每种途径发生的概率都为pk(1−p)n−kpk(1−p)n−k (加法公式)。
在研究连续型随机变量分布后,我们发现二项分布概率分布与高斯分布密度函数曲线一致。
3.2. 泊松分布
若随机变量XX 可能的取值为0,1,2,…0,1,2,… ,且概率分布为
则称XX 服从泊松分布,记为X∼P(λ)X∼P(λ) ,此处λ>0λ>0 是一常数。
Poisson分布是用来描述稀有事件的概率的,比如:一定时间内红绿灯口发生事故的次数和总机接到电话的次数。
Poisson分布实际上是在nn 很大,pp 很小时,二项分布的一个近似:
当pp 很小时,(1−p)∼e−p(1−p)∼e−p [泰勒展开,取前2项],所以(1−p)n−k∼e−p(n−k)∼e−pn=e−λ(1−p)n−k∼e−p(n−k)∼e−pn=e−λ
当nn 很大时,bn,k=n(n−1)…(n−k+1)k!pk(1−p)n−k≈nkpkk!(1−p)n−k=λkk!e−λbn,k=n(n−1)…(n−k+1)k!pk(1−p)n−k≈nkpkk!(1−p)n−k=λkk!e−λ
3.3. 超几何分布
设有N个产品,其中有M个不合格品,若从中不放回地随机抽取nn 个,则其中含有的不合格品的个数XX 服从超几何分布,记为X∼h(n,N,M)X∼h(n,N,M) ,超几何分布的概率分布列为:
其中r=min{M,n}r=min{M,n} ,且M≤N,n≤N,n,N,M均为正整数M≤N,n≤N,n,N,M均为正整数
当n≫Nn≫N 时,即抽取个数nn 远小于产品总数N时,每次抽取后体中的不合格率p=M/Np=M/N 改变甚微,所以不放回抽样,可以近似地看成回抽样,这里超几何分布可以用二项分布近似。
3.4. 几何分布
在伯努利试验序列中,记每次试验中事件AA 发生的概率为pp ,如果XX 为事件AA 首次出现时的试验次数,则XX 可能取值为1,2,…1,2,… ,称XX 服从几何分布,记为X∼Ge(p)X∼Ge(p) ,其分布列为:
几何分布的无记忆性:设X∼Ge(p)X∼Ge(p) ,则对任意正整数m与n有
上面这个公式表明在一系列的事件中,若前m次实验中事件A没有出现,则接下来的n次试验中A仍未出现的概率只与n有关,似乎忘记了前m次试验结果。
3.5. 负二项分布
在伯努利试验序列中,记每次试验中事件A发生的概率为pp ,如果XX 为事件AA 第r次出现时的试验次数,则XX 可能的取值为r,r+1,…,r+m,…r,r+1,…,r+m,… ,称XX 服从负二项分布或巴斯卡分布,记为X∼Nb(r,p)X∼Nb(r,p) ,概率分布为:
4. 连续型随机变量分布
对于连续型变量的概率分布,不能用像离散型变量那种方法去描述。原因在于,这种变量的取值充满一个区间,无法一一排出。若指定一个值aa ,则变量XX 恰好是aa 一丝不差,事实上不可能,即,对于连续型随机变量XX 而言,在区间内任意一点的概率P(X=xi)=0P(X=xi)=0 ,但是你要注意虽然概率为0,但是并不是说事件X=xiX=xi 是不可能事件。
刻画连续型随机变量的概率分布的一个方法是利用概率分布函数,但是在理论和实用上更方便因则更常用的方法,是使用所谓“概率密度函数”或简称密度函数。
定义4.1
设连续性随机变量X有概率分布函数F(x)F(x) ,则F(x)F(x) 的层数f(x)=F′(x)f(x)=F′(x) ,称为X的概率密度函数。
连续型随机变量XX 的密度函数f(x)f(x) 都具有以下三条基本性质:
1)f(x)≥0f(x)≥0
2)∫∞−∞f(x)dx=1∫−∞∞f(x)dx=1
3)对任何常数a<ba<b 有P(a≤X≤b)=F(b)−F(a)=∫ba(x)dxP(a≤X≤b)=F(b)−F(a)=∫ab(x)dx
4.1. 正态分布
由中心极限定理可知:
一个变量如果是由大量微小的、独立的随机因素的叠加结果,那么这个变量一定是正态变量。因此很多随机变量可以用正态分布描述或近似描述,譬如测量误差、产品重量、人的身高、年降雨量等。
若随机变量XX 的密度函数为
p(x)=12π√σe−(x−μ)22σ2,−∞<x<+∞p(x)=12πσe−(x−μ)22σ2,−∞<x<+∞
称XX 服从正态分布或高斯分布。
当μ=1,σ2=1μ=1,σ2=1 时,上面的概率密度函数变为
它是正态分布N(0,1)N(0,1) 的密度函数。同时被称为标准正态分布,其密度函数与分布函数通常分别被记为φ(x)φ(x) 和Φ(x)Φ(x) 。标准正态分布很重要,因为任意的正态分布N(μ,σ2)N(μ,σ2) 的计算很容易转化为标准正态分布N(0,1)N(0,1) 。
若X∼N(μ,σ2)X∼N(μ,σ2) ,则Y=(X−μ)/σ∼N(0,1)Y=(X−μ)/σ∼N(0,1)
4.2. 均匀分布
若随机变量XX 的密度函数为
则称XX 服从区间(a,b)(a,b) 上的均匀分布,记作X∼U(a,b)X∼U(a,b)
4.3. 指数分布
若随机变量XX 的密度函数为
则称XX 服从指数分布,记作X∼Exp(λ)X∼Exp(λ)
下图显示了指数分布当λ=1λ=1 (虚线)和λ=2λ=2 (实线)时的曲线图。f(x)f(x) 在x=0x=0 处不连续。
因为指数分布随机变量只可能取非负实数,所以指数分布被用作各种“寿命”分布,譬如电子元件的寿命,动物的寿命等。
上式表明,如果元件在xx 时尚表现正常,则的X>xX>x 时间内失效率为一个常数λλ ,也就是说元件在任意时刻突然失效的概率跟它使用了多久没有关系,只与失效率lambdalambda 有关。根据后面期望计算得到λ−1λ−1 就是平均寿命。
指数分布描述的是一种无老化的寿命分布,在实际中是不可能的,因而只是一种近似。对一种元器件在使用初期老化现象很小,所以在这个阶段指数分布描述了其寿命分布情况。而人在50或60岁之前,生理老化而死亡的因素是次要的。排除那些意外情况,人的寿命在这个阶段也是接近指数分布的。
4.4. 威布尔分布
指数分布在寿命问题上忽略了老化问题,如果我们需要考虑老化问题,则显然失效率真应该随时间而上升,不能为常数,比如取为一个xx 的增函数:λxmλxm ,那假若分布函数为F(x)F(x) ,则有F′(x)/[1−F(x)]=λxmF′(x)/[1−F(x)]=λxm ,结合F(0)=0F(0)=0 ,得出:
取α=m+1(α>1)α=m+1(α>1) ,并把λ/(m+1)λ/(m+1) 记为λλ ,得到:
概率密度函数为:
实际上指数分布是威布尔分布当α=1α=1 时的特例。
出处:http://www.cnblogs.com/ronny/p/3346568.html
关注我】。(●'◡'●)
如果,您希望更容易地发现我的新博客,不妨点击一下绿色通道的【因为,我的写作热情也离不开您的肯定与支持,感谢您的阅读,我是【Jack_孟】!
本文来自博客园,作者:jack_Meng,转载请注明原文链接:https://www.cnblogs.com/mq0036/p/8399124.html
【免责声明】本文来自源于网络,如涉及版权或侵权问题,请及时联系我们,我们将第一时间删除或更改!
posted on 2018-02-01 15:09 jack_Meng 阅读(2459) 评论(0) 编辑 收藏 举报