随机事件 概率 赌博 泊松分布

概率论是一门研究随机现象规律的数学分支。其起源于十七世纪中叶,当时在误差、人口统计、人寿保险等范畴中,需要整理和研究大量的随机数据资料,这就孕育 出一种专门研究大量随机现象的规律性的数学,但当时刺激数学家们首先思考概率论的问题,却是来自赌博者的问题。数学家费马向一法国数学家帕斯卡提出下列的 问题:“现有两个赌徒相约赌若干局,谁先赢s局就算赢了,当赌徒A赢a局[a < s],而赌徒B赢b局[b < s]时,赌博中止,那赌本应怎样分才合理呢?”于是他们从不同的理由出发,在1654年7月29日给出了正确的解法,而在三年后,即1657年,荷兰的另 一数学家惠根斯[1629-1695]亦用自己的方法解决了这一问题,更写成了《论赌博中的计算》一书,这就是概率论最早的论着,他们三人提出的解法中, 都首先涉及了数学期望[mathematical expectation]这一概念,并由此奠定了古典概率论的基础。
 
使概率论成为数学一个分支的另一奠基人是瑞士数学家雅各布-伯努利[1654-1705]。他的主要贡献是建立了概率论中的第一个极限定理,我们称为“伯 努利大数定理”,即“在多次重复试验中,频率有越趋稳定的趋势”。这一定理更在他死后,即1713年,发表在他的遗著《猜度术》中。
 
到了1730年,法国数学家棣莫弗出版其著作《分析杂论》,当中包含了著名的“棣莫弗—拉普拉斯定理”。这就是概率论中第二个基本极限定理的原始初形。而 接着拉普拉斯在1812年出版的《概率的分析理论》中,首先明确地对概率作了古典的定义。另外,他又和数个数学家建立了关于“正态分布”及“最小二乘法” 的理论。另一在概率论发展史上的代表人物是法国的泊松。他推广了伯努利形式下的大数定律,研究得出了一种新的分布,就是泊松分布。概率论继他们之后,其中 心研究课题则集中在推广和改进伯努利大数定律及中心极限定理。
 
概率论发展到1901年,中心极限定理终于被严格的证明了,及后数学家正利用这一定理第一次科学地解释了为什么实际中遇到的许多随机变量近似服从以正态分 布。到了20世纪的30年代,人们开始研究随机过程,而著名的马尔可夫过程的理论在1931年才被奠定其地位。而苏联数学家柯尔莫哥洛夫在概率论发展史上 亦作出了重大贡献,到了近代,出现了理论概率及应用概率的分支,及将概率论应用到不同范畴,从而开展了不同学科。因此,现代概率论已经成为一个非常庞大的 数学分支。
 
【赌博与随机事件】
 
对待赌博的正确态度有两种。如果实在要把赌博看成是娱乐,把输钱看成是为此而付出的费用,那么,就应该事先想好这个娱乐究竟值多少钱,从而把“消费”严格限制在这个数字以内。如果真正要想赢赌场,你就必须花上足够的时间,了解并掌握赌博这门知识。
 
自然界发生的现象不外乎两类,一类称为决定性现象,这类现象的特点是:在一组条件下,其结果完全被决定,要么完全肯定,要么完全否定,不存在其它的可能性。决定性现象实际上就是事前可以预言结果的现象。
 
还有一类现象称为非决定性现象,这类现象的特点是:条件不能完全决定结果,每次所发生的结果可能是不同的。非决定性现象实际上就是事前不能预言结果的现象,只有事后才能确切知道它所发生的结果,在概率论中,这类现象称为随机现象。
 
随机试验中的任何一次,在实验之前其结果是不可准确预测的,这在概率论中是一个无须证明的结论,作为一门精确的数学学科,概率论研究的是大量随机试验的规 律性。就拿轮盘来说,每一次轮盘出什么号是不可准确预测的——这是轮盘的基本功能,但在无数次的试验中或实验的次数足够多时,轮盘的出号是完全有规律的, 从大量的轮盘出号数据中以及很多人的轮盘赌实践中都可以发现久赌必输、不赌就是赢这个轮盘的真理。
 
赌博是随机现象是指赌博中每一次的输赢都与预测无关,不管由谁来猜,其猜中的概率与猜的人无关,是一个常数,因此赌场从来不猜,而绝大多数赌客却无休止地 猜来猜去。其实爱好赌博的人都很聪明,都很努力,但普通赌客的最大误区在于,以为用赌场提供的记录纸记录轮盘出的号,就能从出号数据中发现每次轮盘出号的 规律,并用它反过来指导预测小球会掉到哪个号上或者是哪个区域里;以为在这个相互作用的过程中不断地修正提高技术,总有达到能赢赌场的一天。普通赌客由于 指导思想和研究的方法不正确,得出的结论自然就很荒唐,反而以为输钱是因为自己技术不精所致,从而更加勤学苦练,希望能有达到目的的一天,在不知不觉中陷 入愈赌愈输、愈输愈赌的怪圈,这是一个没完没了的恶性循环。赌场为普通赌客准备了轮盘记录纸和百家乐记录纸,倒不是因为赌场有多么的高尚,它是在误导赌 客,让你进入怪圈,自制力强者可能从此少与或者干脆不与赌场来往,少数人可能因此走火入魔、患上病态赌博症。
 
赌博不仅是随机试验,而且是古典概型试验,因而赌博中的各种概率都可以准确计算,只是有的简单,几乎不需要思考;有的复杂,必须借助于计算机和巧妙的算 法。例如,轮盘赌中出现号码“0”、“1”、‘“2”……直到“36”等都是基本事件,而大小、红黑、单双则是由基本事件组成的复合事件;拉号子中,任意 五张牌都是基本事件,共有2598960种,而对子、双批、三条……一直到同花大顺等则是由基本事件组成的复合事件;二十一点的情形比较复杂,荷官从牌盒 中每发出一张牌都是基本事件,而出现“2”、“3”、“4”……直到“K”、“A”等牌则是复合事件(因为每种牌都有四种花色);同样的,荷官从牌盒中先 后取出两张牌也是基本事件,而这两张牌的点数则是复合事件;一般地,从牌盒中依次取出某个数量的牌是基本事件,而这些牌的点数则是复合事件。在所有的赌戏 中,输或赢更是非常复杂的复合事件。
 
每一种赌戏都有很多随机变量,其中有些是独有的。如,二十一点中下一张牌的面值就是一个随机变量,它的取值可以是从1到11之间的任何一个整数;荷官按规 则补牌,其牌点也是一个随机变量,它的取值可以是从“17”到“21”之间的任何一个整数,此外还包括“Blackjack”和“爆牌”两个点数;又例 如,百家乐中下一张牌的面值也是一个随机变量,它的取值可以是从0到9之间的任何一个整数;庄闲的点数也是一个随机变量,其取值可以是从“0”到“9”之 间的任何一个整数。
 
不管什么赌戏,都是以输或赢作为赌博的结果,输和赢都是随机事件,把它们数字化,其中,输为负数,赢为正数,就得到了取值随赌博结果的变化而变化的一个随机变量——赔率,这是赌博中最重要的一个随机变量,是任何一种赌戏都必不可少的。
 
赌博作为随机试验,概率分析才是我们研究赌博的有效方法,它涉及到概率论的一些初步知识和现代计算手段,只要不是赌神,其赌博就必然服从于由各种概率所确定的胜负关系,赢赌场的关键在于要洞察概率上是否有有利赌客的情形出现。
 
概率与预测
 
古人云:凡事预则立,不预则废,强调无论做什么事都要预先谋划,事前设计,这离不开对事物和现象的规律的认识。对确定性现象,只有清楚其中的因果关系才能 准确地预测结果。而对随机现象,却只要知道了概率就能进行预测,但应该注意的是,概率要预测的不是随机事件的结果,而是大量随机事件的结果在数量上的规律 性。例如,扔一次硬币,你无法说出是正面还是反面朝上,对此你毫无把握,只能说:“出正面的机会有二分之一”,如果这时还有人说:“出正面的机会有三分之 一”,不管这次出的是哪一面,这两个结论都不能体现出来;但如果扔的是一百次或更多的次数,如一万次,那么“有三分之一机会出正面”的说法就明显站不住 脚,而“有二分之一机会出正面”的说法却可以得到相当程度的体现。下面我们详细地阐述用概率进行预测的原理。
 
大数定律
 
在同样的条件下进行大量试验时,根据频率的稳定性,事件A的频率必然稳定在某一个确定的常数p附近,则定义事件A的概率为:
 
P(A)=p
 
这称为事件概率的统计定义,相应得到的概率称为统计概率,概率的统计定义给出了计算事件概率的近似方法,即当试验次数充分大时,可用事件的频率作为该事件 概率的近似值。然而不能理解为,试验的次数越多,事件的频率就越接近事件的概率。例如,对于扔硬币这样的试验,一个人扔了两次,正好一次正面一次反面,出 现正面的频率为0.5,正好等于出现正面的概率;而另一个人做同样的实验,扔了10000次,出了4985次正面,出现正面的频率为0.4985,反而不 等于出现正面的概率,这扔10000次还不如扔两次的结果精度高,那这多出的9998次是不是就白扔了呢?要解释这个现象,必须更详细地研究频率和概率之 间的关系。
 
实际上,频率是一个随机变量,有多种以至无数种可能的取值,可以是0-1之间的任何一个数字。而概率是一固定的常数,是0-1之间的一个确定数字。我们对 以概率为中心的某一区域感兴趣,频率可能落在这个区域内,也可能落在这个区域之外;对于确定的试验次数n,频率落在区域内这个事件也有一个概率,当试验次 数n增大时,这个概率也增大;当试验次数无限增加时,这个区域将变得无限小,频率落在区域内的概率将等于1。
 
一般地,频率和概率之间的关系不是以普通的等式来表达,而是以事件的频率和概率之差落在某个范围之内的概率来表示,即:
 
P( | μn/n―p|<ε)
 
指定ε的大小,运用概率论中有关切比雪夫不等式的知识就可以计算出这个概率的大小。
 
当试验次数n无限增加时的结论,就是大数定律。大数定律是概率论中一系列定律的总称,又称“大数法则”或“平均法则”,是概率论主要定律之一。
 
历史上,贝努里第一个提出大数法则。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
 
除了文字表述形式,大数定律还有精确的数学表示形式。
 
在贝努利试验中,当试验次数n无限增加时,事件A的频率μn/n(μn是n次试验中事件A发生的次数),依概率收敛于它的概率p。即对任意ε> 0,都有:
 
lim P( | μn/n―p | <ε) = 1
n→∞
 
这就是贝努利大数定律。当然,上面这个公式看起来有些费劲,这没有关系,因为人人都懂它的文字表述,其实对赌客来说,大数定律的文字表述有更现实的指导意 义。概率的统计定义“频率稳定于概率”的意思是很不明确的,贝努利大数定理从数学上讲清楚了这个问题,“频率稳定于概率”的含义是:事件A的频率μn/n 依概率收敛于它的概率p,也即当n充分大时可以以任何接近于1的概率断言,μn/n将落在以p为中心的ε区域。
 
大数定律以明确的数学形式表达了随机试验的规律,并论证了它成立的条件,从理论上阐述了这种大量的、在一定条件下的、重复的随机现象呈现的“频率稳定于概率”的规律性。由于大数定律的作用,大量随机因素的整体作用必然导致某种不依赖于个别随机事件的结果。
 
如果说概率论是有关随机现象预测理论的话,那么大数定律就告诉了我们预测的方法,该如何进行预测。贝努利大数定律从理论上证明了通过试验来确定概率的方 法:做n次独立的重复试验,以μn表示n试验中A发生的次数,当n足够大时,那么我们可以以很大的概率确信:p≈μn/n。在事件的概率未知或者需要验证 理论计算出的概率是否准确时,我们常用这种方法。
 
反过来,已知事件的概率,当n足够大时,就可以用事件的概率来预测n重贝努利试验中事件发生的次数: μn≈p×n ,其中n越大,预测的可信度就越高。赌场里任何赌戏的每一次都只有赢和不赢两种结果(“和”或“平”可看成是50%的赢),赌博就是贝努利试验。准确地计算出赌戏的赢率,就可用来预测赌博的结果,其依据就是大数定律。赌的时间越长,预测就越有效。
 
现在就可以来解释前面提到的现象。扔两次硬币,还有可能出现两次都是正面或两次都是反面的情况,把这时的频率当作概率显然是错误的,就是说把扔两次硬币的 频率当作是概率,发生严重偏差的概率高达50%,而把扔10000次硬币的频率当作概率在绝大多数情况下结果都是相当可信的。结论是,试验10000次比 试验两次得到的结果更可信,并不违反直觉所告诉我们的。
 
因此,用统计方法来确定事件的概率时,频率随试验次数的增加接近概率也是以概率的方式。统计的次数越多,频率接近概率的可能性就越大,其结果就越可信,可 以认为,统计次数反映了结果的可信程度,而此时的频率结果与概率有多接近则有一定的随机性。换言之,通过试验来确定概率是有风险的,在任何情况下,都有频 率偏离概率的情形存在,增加试验的次数,可以降低这种风险,却不能消除风险本身,只有在试验次数为无穷大的情况下,才不存在这种风险。不过,当试验的次数 是足够多时,尽管把频率当成是概率还是有出错的可能,但这种可能性已经非常小了,以至可以完全放心而无须担心出错。
 
赌博就是赌概率
 
轮盘上连出了十次红,有人就觉得第十一次该出黑了;连出了二十次红,第二十一次就更应该出黑了……因此产生了在赌博中经常遇到的连续出大后押小、连续出庄 后押闲、连输后加注等错误方法,称为反向赌法,反向赌法配合赌注的变化就产生了在赌场广泛流行的“注码法”,并有了一个似乎更充足的理由:在多次的连续投 注中,只要赢一次,就能把以前输的全部赢回来,并再多赢一点,有必要把它弄清楚。
 
这类反向赌法有个特点,就是概率已经事先知道且接近二分之一,例如,我们可以一口说出扔硬币出正面的概率是1/2;轮盘上除了0之外,代表红黑的数字的个 数是相等的,无疑出红和出黑的概率是相等的且接近二分之一……这给我们一种感觉,似乎概率是随机事件随时可以表现出来的一个性质。而在股市中,涨和跌的概 率是模糊不清不明朗的,因此大家都追涨杀跌,更少有人采用注码法,表现得完全相反。
 
长期以来,人们习惯于从无例外只有一个结果的确定关系法则,例如,在时间上,某个节日越来越近,我们甚至用倒计时的方式来表示这种关系;在距离上,只要我 们朝着目的地进发,我们将离它越来越近,我们习惯于这种物理上的接近,也就是通常的越来越近。却还不习惯若即若离,总的态势是趋近的这种概率方式的接近, 概率方式的接近意味着有的时侯离得近,有的时侯离得远,不接近是很自然而然的,例如,在小样本时,频率偶尔会集中在概率附近,在大样本时,频率多数时候会 集中在概率附近,但不管是大样本还是小样本,都无法避免频率严重偏离概率这样的情形出现;而这时人们习惯于套用从无例外的确定关系法则,以为小样本时经常 性地连续出红这种严重偏离的情形是一种反常,在随后的试验中会很快得到纠正;其实,轮盘没有记忆,记住以前的结果并要对此进行纠正的是人不是轮盘。以确定 性关系来代替对象之间的概率关系是人们不知不觉中易犯的错误。
 
频率和概率之间的关系是用概率来描述,通常二者是不等关系,一般不能划等号,只有当试验的次数很大时,才有μn/n≈p,并始终存在例外出错的可能性。认 清频率和概率的这种关系,将有助于克服连续出大后押小、连续出庄后押闲、连输后加注等不正确的赌博心理,这类错误认识的根源就在于不分条件地把频率和概率 用等号联系了起来。
 
下意识里,我们对扔硬币这类机会均等的随机试验有个预测,就是在连续的数次试验中出现正反的次数应该很接近,由频率和概率的关系可知,这个预测经常会有很 多不准的时候。轮盘出十个结果,多数时候这十个结果中红和黑的比例比较接近,如果连出了十次红,只说明预测是不准的,就好比天气预报,如果连续十天预报不 准,那么第十一天的预报是不是会更准一点呢?一般人都不会这么认为,我们更有理由认为气象部门内部出了什么问题,预测结果将更加不准。当然,与天气预报不 同,对轮盘的预测不受人为因素的影响。
 
比用概率来预测少量试验的频率还要糟糕的是,人们习惯于用概率来预测下一次随机事件的结果,并把它和前几次试验的频率联系起来。其实,不管前面的频率和概 率差得有多远,继续试验,后来试验的频率只和概率有关,和以前的频率无关,而对于仅仅一次试验的结果,我们只能泛泛地说某个事件发生的概率。
 
概率只有用来预测大量试验的频率可信度才很高,要提高预测的准确性,只有靠提高所预测的范围。如预测从第11次到第1010次,你说出正面的次数接近500次,这预测的准确性要远远高于预测第十一次的结果。
 
从另一个角度来看,大样本可以划分为许多等量的小样本,把小样本中某类特定的组合,如连续出正面看成是一个事件,这是一个小概率事件,由大数定律很容易推 论出,在长期不断的实验中,小概率事件是几乎一定会发生的,但人们往往把它当成了不会出现、不应该出现的概率为零的事件。在扔硬币这样的试验中,出正反面 的概率是一样的,都是50%,当出现正面时,不会产生马上要出反面的错觉;同样的试验,当我们以不连续出“正面”和连续出“正面”作为观察对象时,二者的 概率大不一样,前者的概率远大于后者,由于后者的概率很小,一旦出现,马上就会产生这种现象应该马上终止的错觉;事实上,连续出“正面”的概率再小,也是 一个不为0的数字,只要它不等于0,只要试验的时间足够长,连续出“正面”就几乎一定会发生,是一种不可避免的现象。一旦出现了,就和扔硬币出了反面一样 正常,没有什么大惊小怪的。
 
有趣的是,同样是小概率事件,有的我们希望它发生,有的又希望它不发生。赌博中连输是赌客不希望发生的,一旦发生了,总是希望这种已经发生了的小概率事件 能很快终止,因此往往在连输时加大注码。另一个事实是,对个人来说,中六合彩是小概率事件,我们却希望它发生在自己身上,如果有人中了,不会因为这是个极 小概率事件而拒绝它,都会很乐意接受这个事实。应该象接受中六合彩一样来接受已经连续出了十次红这样的事实。
 
随机试验与事件
 
随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。
 
随机试验:对随机现象的试验或观测,它必须满足以下的性质:
 
(1)每次试验的可能结果不是唯一的;
(2)每次试验之前不能确定何种结果会出现;
(3)试验可在相同条件下重复进行。
 
随机事件(事件):在随机试验中,可能出现也可能不出现的结果。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件, 又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有n个基本事件,分别记为(i=1,2,…,n)。集合 Ω={ω1 ,ω2 , … ,ωn}称为样本空间,Ω中的元素就是样本点。
 
例:投掷一粒均匀的六面体骰子,出现的点数有可能是1、2、3、4、5、6共六种。这六种结果是基本结果,不可以再分解成更简单的结果了,所以Ω= {1,2,3,4,5,6}为该试验的样本空间。“出现点数是奇数”这一事件就不是简单事件,它是由基本事件{1},{3}和{5}组合而成的。我们通常 用大写字母A,B,C,…来表示随机事件,例如,设A表示“出现点数是奇数”,则A={1,3,5};设B表示“出现点数是偶数”,则B= {2,4,6}。
 
概率的定义
 
概率就是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性的度量。 进行n次重复试验,随机事件A发生的次数是m次,发生的频率是m/n,当试验的次数n很大时,如果频率在某一数值p附近摆动,而且随着试验次数n的不断增加,频率的摆动幅度越来越小,则称p为事件A发生的概率,记为:P(A)=p。在古典概型场合, 即基本事件发生的概率都一样的场合:P(A)=m/n
 
例:设一个袋子中装有白球2个,黑球3个。(1) 从中随机摸出1只球,问刚好是白球的概率有多大?   (2) 从中随机摸出2只球,一问2只球都是白球的概率有多大? 二问2只球一白一黑的概率有多大? 三问2只球都是黑球的概率有多大?
 
解:(1) 由于摸出的任何1只球都形成一个基本事件,所以样本点总数为n=5。用A表示摸出的是白球事件,则A由两个基本点组成,即A={白球,白球},有利场合数m=2。因此,刚好摸出白球的概率为P(A)=m/n=2/5=0.4
(2) 由于摸出2只球才成一个基本事件,所以样本点总数为10故
P(A)=P(2只球都是白球)=1/10
P(B)=P(2只球一白一黑)=2×3/10=6/10
P(C)=P(2只球都是黑球)=3/10
NOTE: P(A+B+C)=1
 
概率的基本性质
 
性质1      1≥P(A)≥0。
性质2      P(Ω)=1。
性质3     若事件A与事件B互不相容,即AB=Ф,则P(A∪B)=P(A)+P(B)。
推论1    不可能事件的概率为0,即:P(Ф)=0。
推论2     P(A)=1-P(A),       表示A的对立事件,即它们二者必有一事件发生但又不能同时发生。
 
概率的运算法则——加法公式
用于求P(A∪B)——“A发生或B发生”的概率
互斥事件(互不相容事件)
不可能同时发生的事件
没有公共样本点
互斥事件的加法公式
P(A∪B)=P(A)+P(B)
互补事件
不可能同时发生而又必然有一个会发生的两个事件
互补事件的概率之和等于1
 
例如:掷一个骰子,“出现2点”的概率是1/6,则“不出现2点”的概率就是5/6 。
相容事件
两个事件有可能同时发生
没有公共样本点
相容事件的加法公式(广义加法公式 )
P(A∪B)=P(A)+P(B)-P(AB)
 
概率的运算法则——乘法公式
用于计算两个事件同时发生的概率。
——也即 “A发生且B发生”的概率 P(AB)
先关注事件是否相互独立
条件概率—在某些附加条件下计算的概率
在已知事件B已经发生的条件下A发生的条件概率——P(A|B)
条件概率的一般公式:
P(A|B)=P(AB)/P(B)
乘法公式的一般形式:
P(AB) =P(A)·P(B|A)
或    P(AB) =P(B)·P(A|B)
 
(1)条件概率
P(A|B)=在B发生的所有可能结果中AB发生的概率
即在样本空间Ω中考虑的条件概率P(A|B),就变成在新的样本空间B中计算事件AB的概率问题了
事件的独立性
两个事件独立
一个事件的发生与否并不影响另一个事件发生的概率
P(A|B)=P(A),或 P(B|A)=P(B)
独立事件的乘法公式:
P(AB) =P(A)·P(B)
推广到n 个独立事件,有:
P(A1…An)=P(A1)P(A2) … P(An)
概率的运算法则——全概率公式
完备事件组
事件A1、 A2、…、An互不相容,
A∪A2∪…∪An=Ω
且P(Ai ) > 0(i=1、2、...、n)
对任一事件B,它总是与完备事件组A1、 A2、…、An之一同时发生,则有求P(B)的全概率公式:
概率的运算法则——贝叶斯公式
全概率公式的直观意义:
每一个Ai的发生都可能导致B出现,每一个Ai 导致B发生的概率为,因此作为结果的事件B发生的概率是各个“原因”Ai 引发的概率的总和
相反,在观察到事件B已经发生的条件下,确定导致B发生的各个原因Ai的概率
 
——贝叶斯公式(逆概率公式)
 
(后验概率公式)
随机变量及其概率分布
随机变量的概念
随机变量——表示随机试验结果的变量
取值是随机的,事先不能确定取哪一个值
一个取值对应随机试验的一个可能结果
用大写字母如X、Y、Z...来表示,具体取值则用相应的小写字母如x、y、z…来表示
根据取值特点的不同,可分为:
离散型随机变量——取值可以一一列举
连续型随机变量——取值不能一一列举
离散型随机变量的概率分布
X的概率分布——X的有限个可能取值为xi与其概率 pi(i=1,2,3,…,n)之间的对应关系。
概率分布具有如下两个基本性质:
(1) Pi≥0,i=1,2,…,n;
(2)ΣPi=1
离散型概率分布的表示:
概率函数:P(X= xi)= pi
分布列:
分布图
连续型随机变量的概率密度
连续型随机变量的概率分布只能表示为:
数学函数——概率密度函数f (x)和分布函数F (x)
图    形——概率密度曲线和分布函数曲线
概率密度函数f (x)的函数值不是概率。
连续型随机变量取某个特定值的概率等于0
只能计算随机变量落在一定区间内的概率
——由x轴以上、概率密度曲线下方面积来表示
分布函数
适用于两类随机变量概率分布的描述
分布函数的定义: F(x)=P{X≤x}
常见离散型随机变量的概率分布
二项分布
n重贝努里试验:
一次试验只有两种可能结果
用“成功”代表所关心的结果,相反的结果为“失败”
每次试验中“成功”的概率都是 p
n 次试验相互独立。
二项分布图形
p=0.5时,二项分布是以均值为中心对称
p≠0.5时,二项分布总是非对称的
p<0.5时峰值在中心的左侧
p>0.5时峰值在中心的右侧
随着n无限增大,二项分布趋近于正态分布
Piosson分布的意义
盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000
在100次抽样中,抽中1,2,…10个白棋子的概率分别是……
放射性物质单位时间内的放射次数
单位体积内粉尘的计数
血细胞或微生物在显微镜下的计数
单位面积内细菌计数
人群中患病率很低的非传染性疾病的患病数
 
特点:罕见事件发生数的分布规律
 
【说明】历史上Poisson分布是作为二项分布的近似于1837年由法国数学家泊松引入的,若把试验中成功概率值很小的事件叫做稀有事件,则由上面TH当n充分大时,n重B-试验中稀有事件发生的次数近似服从Poisson分布。这时,参数λ的整数部分 [ 恰好是稀有事件发生的最可能次数,在实际中常用Poisson分布来作为大量重复独立试验中稀有事件发生的概率分布情况的数学模型,诸如不幸事件,意外事故、故障,非常见病,自然灾害等,都是稀有事件。
 
许多随机现象都服从Poisson分布。一是社会生活对服务的要求:如电话交换机中来到的呼叫次数;公共车站来到的乘客数都近似服从Poisson分布。另一领域是物理学。放射性分裂落到某区域的质电点;热电子的放射等都服从Poisson分布。
 
一、泊松分布的定义及图形特点
 
设随机变量X所有可能取的值为0 , 1 , 2 , … , 且概率分布为:
 
随机事件 <wbr><wbr>概率 <wbr><wbr>赌博 <wbr><wbr>泊松分布(Poisson <wbr><wbr>distribution)
常用于描述单位时间、单位平面或单位空间中罕见“质点”总数的随机分布规律。
罕见事件的发生数为X,则X服从Piosson分布。
 
二、二项分布与泊松分布
 
历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的 .
在实际中,许多随机现象服从或近似服从泊松分布.
Example In his book, Feller discusses the statistics of flying bomb hits in the south of London during the Second World War.
Assume that you live in a district of size 10 blocks by 10 blocks so that the total district is divided into 100 small squares. How likely is it that the square in which you live will receive no hits if the total area is hit by 400 bombs?
 
用 X 表示落入该小区内的炸弹数,则
X~B(400,1/100)   n=400, p=1/100
因此 P(X=0)=(99/100)^400
用Poisson分布近似计算。。
X近似服从参数为 4 =np=400*1/100的Poisson 分布
即 X~P(4)
因此 P(X=0)=exp(-4)
P(X=0)=(99/100)^400
可以计算(99/100)^400= 0.01795055328
exp(-4)= 0.01831563889
我们把在每次试验中出现概率很小的事件称作稀有事件.
如地震、火山爆发、特大洪水、意外事故等等
由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.
 
三、泊松分布产生的一般条件
 
在自然界和人们的现实生活中,经常要遇到在随机时刻出现的某种事件.我们把在随机时刻相继出现的事件所形成的序列,叫做随机事件流.
若事件流具有平稳性、无后效性、普通性,则称该事件流为泊松事件流(泊松流).
下面简要解释平稳性、无后效性、普通性.
平稳性:
在任意时间区间内,事件发生k次(k≥0)的概率只依赖于区间长度而与区间端点无关.
无后效性:
在不相重叠的时间段内,事件的发生是相互独立的.
普通性:
如果时间区间充分小,事件出现两次或两次以上的概率可忽略不计.
例如
一放射性源放射出的А粒子数;
某电话交换台收到的电话呼叫数;
到某机场降落的飞机数;
一个售货员接待的顾客数;
一台纺纱机的断头数;
都可以看作泊松流.
对泊松流,在任意时间间隔(0,t)内,事件(如交通事故)出现的次数服从参数为λt 的
泊松分布. λ称为泊松流的强度.
独立同分布的中心极限定理
(也称列维一林德伯格定理)
设X1, X2, …是独立同分布的随机变量序列,且存在有限的μ和方差σ2(i=1,2,…),当n→ ∞时,
上述定理表明
独立同分布的随机变量序列不管服从什么分布,其n项总和的分布趋近于正态分布。
可得出如下结论:
不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量n充分大,就趋于正态分布。
该定理为均值的抽样推断奠定了理论基础。
 
例1 一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述,为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?
解:
设该商品每月的销售数为X,
已知X服从参数λ=5的泊松分布.
设商店在月底应进某种商品m件,
于是得m+1=10,m=9件
n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.
泊松分布在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位。
例2:设儿童在注射乙肝疫苗产生不良反映的概率为0.001,试确定2000个儿童中有3个以及多于两个儿童产生不良反应的概率?
P=0.323
例3:保险事业是最早使用概率论的部门之一,保险公司为了估计其利润,需要计算各种概率。 保险公司现在为社会提供一项人寿保险,据已有的资料显示:人群中与这项保险业务有关的死亡概率为0.0020,今有2500人参加这项保险,每个参保的人 员在每年1月1日交付120元保险金,而在死亡时家属可从公司领20000元保险金。试问:(1)保险公司亏本的概率是多少?
(2) 保险公司赢利不少于10万元、20万元的概率是多少?
解:每年1月1日,保险公司的收入30万元=120 ,若一年中死亡 人,则保险公司这一年应付出20000 元,因此“公司亏本”意味着20000 >300000 即 >15人,这样“公司亏本”这一事件等价于“一年中多于15人死亡”的事件,从而转而求“一年中多于15人死亡”的概率,若把“参加保险的一个人在一年中是否死亡”看作一次随机试验,则问题可用n=2500 ,p=0.002 的 试验来近似,
P{保险公司赢利不少于100000元}=0.986305
P{保险公司赢利不少于200000元}=0.615961
例4:某区税务机关为了对税收缴纳服务窗口做出合理安排,需要对该区一个征收点顾客到达情况进行调查。顾客到达服从泊松分布,根据观测的结果,平均每30分钟有4名顾客。问:
(1) 在30分钟内恰好有3位顾客到达的概率有多大?
(2) 在30分钟内,有4位以上顾客到达的概率有多大?
解:设在30分钟内到达的顾客数为随机变量X,由题设知X~P(4).
(1) 在30分钟内恰好有3位顾客到达的概率有多大?
P(X=3)=e^(-4)*4^3/3!=0.1954.
(2) 在30分钟内,有4位以上顾客到达的概率有多大?
P(X≥4)=1-P(X=0)-P(X=1)-P(X=2)-P(X-3)
=1-0.0183-0.0733-0.1465-0.1954=0.5665
例5:为保证设备正常工作,需要配备质量适量的维修人员,共有300台设备,每台工作相互独立,发生故障的概率都是0.01,若在通常情况下,一台设备的故障可由一人来处理,问至少应配备多少维修人员才能保证当设备发生故障时不能及时维修的概率为小0.01?
若一人负责20台,求这20台设备发生故障而不能及时处理的概率?
若3人负责80台,求这80台设备发生故障而不能及时处理的概率(平均每人负责27台)
解:设X为300台设备同时发生故障的台数,
X~B(n,p),n=300, p=0.01
设需配备N个维修人员,所求的是满足
P(X>N) < 0.01的最小的N.
P(X>N)= 1-P(x≤N)<0.01
P(x≤N)≥0.99
λ=nP=300*0.01=3
只需配备8名工人
此时,X~B(20,0.01)所求概率为
P(x≥2)=1-P(x<2)=1-P(x=0)-P(x=1)≈0.017523
λ=np=20*0.01=0.2
若3人负责80台,求这80台设备发生故障而不能
及时处理的概率(平均每人负责27台)
X~B(80,0.01)
λ=nP=80*0.01=0.8
P(x≥4)≈0.0081
posted @ 2016-09-10 11:12  lclc  阅读(3063)  评论(0编辑  收藏  举报