大数定理详解(转载)

注:此文出处来自http://blog.sina.com.cn/s/blog_5ecbb4950101kzhu.html

 

1、大数法则
一位数学家调查发现,欧洲各地男婴与女婴的出生比例是22:21,只有巴黎是25:24,这极小的差别使他决心去查个究竟。最后发现,当时的巴黎的风尚是重女轻男,有些人会丢弃生下的男婴,经过一番修正后,依然是22:21。中国的历次人口普查的结果也是22:21。

人口比例所体现的,就是大数法则。
大数法则(Lawoflargenumbers)又称“大数定律”或“平均法则”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这类规律就是大数法则。在试验不变的条件下,重复试验多次,随机事件的概率近似于它的概率。
大数法则反映了这世界的一个基本规律:在一个包含众多个体的大群体中,由于偶然性而产生的个体差异,着眼在一个个的个体上看,是杂乱无章、毫无规律、难于预测的。但由于大数法则的作用,整个群体却能呈现某种稳定的形态。

花瓶是由分子组成,每个分子都不规律地剧烈震动。你可曾见过一只放在桌子上的花瓶,突然自己跳起来?
电流是由电子运动形成的,每个电子的行为杂乱而不可预测,但整体看呈现一个稳定的电流强度。
一个封闭容器中的气体,它包含大量的分子,它们各自在每时每刻的位置、速度和方向,都以一种偶然的方式在变化着,但容器中的气体仍能保有一个稳定的压力和温度。

某个人乘飞机遇难,概率不可预料,对于他个人来说,飞机失事具有随机性。
但是对每年100万人次所有乘机者而言,这里的100万人可以理解这100万次的重复试验,其中,总有10人死于飞行事故。那么根据大数法则,乘飞机出事故的概率大约为十万分之一。
这就为保险公司收取保险费提供了理论依据。对个人来说,出险是不确定的,对保险公司来说,众多的保单出险的概率是确定的。

根据大数法则的定律,承保危险的单位越多,损失概率的偏差越小,反之,承保危险的单位越少,损失概率的偏差越大。因此,保险公司运用大数法则就可以比较精确地预测危险,合理保险费率。

2、小刀锯大树
赌客久赌必输的另一个秘密,即大数法则。

赌王何鸿燊刚刚接手葡京赌场的时候,业务蒸蒸日上。
赌王居安思危,请教“赌神”叶汉:“为什么这些赌客总是输,长此以往他们不来赌怎么办?”
叶汉笑道:“这世界每天都死人,你可见这世上少人?”

叶汉的回答甚妙,道出了一条无论是保险公司、赌场还是骗徒,都信仰的法则:大数法则。
赌场本质上是一种温和的“概率场”,概率法则非常明显。一直玩下去,大数法则的作用就会日益显现出来。
庄家在规则上占有少许优势,玩的次数越多,这种优势越能显现出来。

久赌神仙输,赌圣也不行。
一天,一位沙特王子入住葡京酒店。
王子找到赌王,说:我就和你玩一把掷硬币。出正面我给你50亿美元,出反面你的赌场归我。
赌王呵呵一笑:这个游戏固然公平,但不符合我们博彩业的行事法则。
我们开赌场不做一锤子买卖,而是小刀锯大树。如果你真的想玩,我们就玩掷骰子,1000下定输赢。你赢了,可以把我的产业拿走,我赢了,只收你20亿。
沙特王子无奈,只好退出赌局。
这个故事是虚构的,旨在说明大数法则之于赌场的意义。

开赌场不做一锤子买卖,而是“小刀锯大树”。
所以,赌场最欢迎的是斤斤计较、想碰一下运气的散客,他们虽然下注谨慎,却构成了庞大的行为基数。
这种客人会给赌场老板带来几乎线性的稳定收益,是赌场最稳定的收入来源,这是大数法则在起作用。

还有一种是一掷千金、豪气干云的大赌客,他们的下注额若在赌场的风险控制范围,也很难从赌场赢钱,会成为赌场的VIP客户。
假如有一个超级赌客,比如上面虚构故事中的沙特王子。他的赌注超过了普通赌客的千倍万倍,这会导致赌场收益的大幅震荡,极端情况下可能导致赌场破产。
因此,全世界所有赌场都会设定最高的投注限额。赌场设最低及最高的投注限额,即便“新郎行运一条龙”的事故发生,也不至于让赌场亏太多。这样,赌场老板就可以安心睡觉了。
所有的VIP加起来,等于庄家和客人玩了一场长期游戏,大数法则依然有效。

3、“撞骗”的数理依据
你是否收到过这类短信:
请直接把钱打到工商银行卡号6220219 ***

这叫“撞骗”,是一种传统骗术。版本甚多,比如寄中奖信、打中奖电话、发电子邮件。
也就是骗子像没头苍蝇一样乱撞,“有枣没枣打一杆子”或许能“瞎猫捡个死老鼠”。
是不是觉得骗子很蠢?但骗徒的行为却是合乎统计原理的,在数理上是被支持的。

只要发出的短信足够多,其成功率非常稳定,合乎大数法则。
福建的某个小镇,众多乡亲都从事这个行当,短信群发器在这个偏远小镇非常普及。
当警察抓获了这批***民后,奇怪的是,过了很长时间了,居然还有人不断地往查获的卡上汇钱。

有人曾做过统计,类似这种垃圾短信,每发出一万条,上当的人有七到八个,成功率非常稳定。人过一百,形形色色。一万个人里面,总会有几个“人精”,几个笨蛋,这是可以确定的。
究其根源,都是由于大数法则的作用。在社会、经济领域中,群体中个体的状况千差万别,变化不定。但一些反映群体的平均指针,在一定时期内能保持稳定或呈现规律性的变化。

大数法则是保险公司、赌场、撞骗的骗徒,赖以存在的基础

4、广结善缘
大数法则不仅是保险精算中确定费率的主要原则,它还是推销员的制胜之道。

大数法则用在业务员的人脉管理上,就是结识的人数越多,预期能够带来的商业机会的比例越稳定。
比如说,一个推销员给自己定下任务,每年结识300个客户或潜在客户,并把关系维系好。那么,三年后,他就有接近1000个“样本”。
如果100个客户里会有3个长期客户,三年后,他就有大约30个能给他带来稳定收益的老客户。

欧洲有位大亨,每年都定下目标,要与1000个人交换名片,并与其中的200个人保持联络,与其中的50个人成为朋友。

5、无视样本大小
30多年前的一个下午,在芝加哥的一间咖啡馆里,特韦斯基和约翰·杜伊教授在悠然地喝着咖啡。特韦斯基貌似无心地问:有两家医院,在较大的医院每天都有 70个婴儿出生,较小的医院每天有20个婴儿出生。众所周知,生男生女的概率为50%。但是,每天的精确比例都在浮动,有时高于50%,有时低于50%。 在一年的时间中,每个医院都记录了超过60%的新生儿是男孩的日子,你认为哪个医院有更多这样的日子?

我们知道,大数法则需要很大的样本数才能发挥作用,基数越大,就越稳定。随着样本的增大,随机变量对平均数的偏离是不断下降的。所以,大医院更稳定。这一基本的统计概念显然与人们的直觉是不符的。
杜伊先生果然钻进了圈套,他认为较大的医院有更多超过60%的新生儿是男孩的日子。
一个整天向学生灌输大数法则的教授,自己居然不相信大数法则!
普通人又如何呢?

特韦斯基后来把这个问题做了严格的实验。22%的受试者认为较大的医院有更多这样的日子,而56%的受试者认为两个医院有相等的可能性,仅22%的受试者正确地认为较小的医院会有更多这样的日子。

6、小数法则
大数法则是统计学的基本常识,有人称为“统计学的灵魂”。大数法则虽然威力无穷,普通人却因其貌不扬而忽视。
针对人们在思考时常常无视大数法则的现象,特韦斯基提出了“小数法则”的概念。“小数法则”不是什么定律或法则,而是一种常见的心理误区。

用错误的心理学“小数法则”代替了正确的概率论大数法则,这是人们赌博心理大增的缘由。
小数法则是一种心理偏差,是人们将小样本中某事件的概率分布看成是总体分布。人们在不确定性的情形下,会抓住问题的某个特征直接推断结果,而不考虑这种特征出现的真实概率及与特征有关的其他原因。

总体分布:总体取值的概率分布规律 
在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布。 一般地,样本容量越大,这种估计就越精确。

小数法则是一种直觉思维,很多情况下,它能帮助人们迅速地抓住问题的本质推断出结果,但有时也会造成严重的偏差。

7、做生意,不要相信“小数法则”

大数法则是一种统计定律;小数法则是一种心理偏差。

大数法则是一种科学;小数法则是一种迷信。

大数法则是中性词;小数法则是贬义词。

8、股神大哥的预测模式
行为经济学家马修·拉宾曾假设:如果你是一位投资者,你亲见一位基金经理在过去两年中的投资业绩好于平均情况。你是否就会得出这位经理要比一般经理优秀的结论?
你的结论???
然而真实的统计意义非常微弱。

让我们来看看股神大哥的预测股票的模式。
第一周发10000条短信,股神大哥预言某支股票的涨跌。其中5000条说某只股票涨,5000条说跌。
第二周股神大哥向其中说对的5000人再发一短信,其中2500条说某只股票涨,2500条说某只股票跌。
第三周他再向说对的2500人发短信,其中1250条说某只股票会涨,1250条说某只股票会跌。
最后有1250人,发现这位股神大哥连续3次说对某只股票的涨跌,简直太崇拜了。
其中有500人真的把钱交给他投资了。当然,如果赚钱是要分成的。

股神大哥拿到钱后会做什么呢?他会给这500个不同的账户各买一只股票,尽量让这些股票各不相同。一段时间过后,股票有的涨,有的跌。
如果一个人的账户买了一只涨的股票,他对股神阿猫就会更加信赖,甚至还会追加投资。
假如碰到一个大牛市,大部分时间里,大部分股票上涨概率大大超过下跌。因此,股神大哥的这种模式是非常有钱途的。
假如来了个大熊市,大部分股票在大部分时间下跌超过上涨,股神大哥也是不用负责,大不了退出江湖而已。

9、赌客谬误
小数法则的经典表现就是“赌客谬误”。

李太太一连生了五个女儿。
李太太:希望我们下一个孩子是男孩。
李先生:亲爱的,都生了五个女儿了,下一个肯定是儿子。
李先生对吗?
众所周知,掷硬币正、反面出现的概率为50%,在掷硬币游戏中,如果前几次大多数出现正面,那么很多人会相信下一次投掷很可能出现反面。这就是赌客谬误,也是很多赌客信心大增的原因。
赌客谬误的产生,是因为人们错误地诠释了“大数法则”的平均律。投资者倾向于认为大数法则适用于大样本的同时,也适用于小样本。

赌博是随机事件。
一枚硬币,连出三把都是正面,那么下一把出反面的概率仍然不会大于50%。
从理论上讲,硬币也好,骰子也好,既没有记忆,也没有良心,概率法则支配一切。

随便到一家合法的赌场,就能看到这种赌客“猜反正”的现象:
连输几次就该赢了
连出几次红就感觉该出黑了
连出几张小牌肯定该出大牌了

这是很多赌客感觉能战胜庄家的理论依据,甚至很多有学问的赌徒写的“赌经”,都明显带有这种错误。
10、连抛100下硬币,会一直出正面吗
在《黑天鹅》一书中,作者尼古拉斯·塔勒布向两个虚构人物请教一个问题。
一个是“肥佬汤尼”,一个粗俗的,靠投机钻营致富的家伙
一个是博士约翰,一位诚实的学者。

尼古拉斯:假设硬币是绝对公平的。连续抛出99次,每次都得到正面。我下一次得到反面的概率有多大?
约翰博士:“超简单!当然是50%,因为你假设硬币是绝对公平的。”
尼古拉斯:“汤尼,你认为呢?”
肥佬汤尼:“很显然,不会超过1%。”
尼古拉斯:“为什么?我最初假定硬币是公平的,每面都有50%的概率。”
肥佬汤尼:“这游戏是不公平的,这枚硬币里一定做了手脚。
谁相信所谓“50%”的说法,他要么是个草包,要么是个大草包。”
尼古拉斯:“但约翰博士说是50%。”
肥佬汤尼趴在在尼古拉斯耳边小声说:“我在银行当保安的时候,就曾经和这类傻瓜做同事,你可以利用他们赚大钱。”
肥佬汤尼认为,在硬币连抛99次,每次都得到正面的情况下,绝对均匀的假定是虚构的。

而约翰博士的回答可能代表了教科书的标准答案。
一枚绝对均匀的硬币,绝对公平地掷出。连续99次都是正,接下来要再掷出一次,你认为出正的概率大,还是出反的概率大?
A.出正概率大
B.出反概率大
C.各占50%

Jay是英国某著名大学的计量金融学博士,他很谨慎地选择了C。
此时,另一位朋友插进话来,非常确定地选择A。
笔者问:“为什么呢?”
这位朋友说:“因为我是教统计学的老师,并且这种事件,历史上真的曾经发生过。”
笔者:“那些钱币应该是两面都是正吧?”
教统计学老师:“嘿嘿,是的。”

这位讲师朋友所谓的曾经发生的事件,是一般概率课上都会讲到的一个典故。
宋朝大将狄青受命平叛。当时朝廷中主和、妥协派势力颇强,狄青所部亦有些将领怯战。
狄起兵祭旗,他手捧100枚铜钱,对众将士说,如果我扔下的100枚铜钱都是正面朝上,则必定是上天恩赐,让我们大胜而归。
许多将军都劝狄青不要这样做,狄青坚持。当他把100枚铜钱扔到地上时,众将士都不相信自己的眼睛,奇迹发生了,100枚铜钱全正面朝上。于是,士气大振。
狄青令人将100枚铜钱钉在地上,派重兵把守,若有人翻动铜钱,格杀勿论。
当狄青获胜班师回朝,把铜钱收回时,有一些将士才发现,这100枚铜钱两面都是正面。

11、延伸阅读:雅各布与大数法则
雅各布·贝努利(Jacob Bernoulli)
1654年生于瑞士,他没有遵照父亲的意思去当律师或经商,而是自学成为了一名数学家。

雅各布和牛顿生活在同一时代,他有着贝努利家族传统的自负心态,他认为自己和牛顿不相上下。
1703年,雅各布·贝努利率先提出了如何从样本中发现概率的问题。
雅各布教授自己的弟弟约翰数学。约翰和雅各布一样聪明,而且和他的哥哥一样,他是个对名声的追求近乎病态的人。
雅各布和弟弟约翰有一个习惯,就是对一个问题有竞争性地进行研究,并且在媒体中毫不留情地攻击对方。
雅各布虽然发现了大数法则,但由于兄弟俩在科学问题上过于激烈地争论,致使双方的家庭也被卷入。

雅各布死后,他的《猜度术》手稿被他的遗孀和儿子在外藏匿多年,直到1713年才得以出版。
《猜度术》是雅各布·贝努利一生最有创造力的著作,在这部著作中,他提出了概率论中的“贝努利定理”,该定理是“大数法则”的最早形式。
为了说明大数法则,雅各布假设了一个装满3000枚白色石子和2000枚黑色石子的罐子,但外人不知道每个颜色的石子的数目。

我们从罐子中,按不断增加的数目取出石子,并在将它们放回瓶子之前,记录每枚石子的颜色。
如果我们取出越来越多的石子,最终我们会得到“接受必然的可能性”,也就是说,在实际事件上是必然的,但又不是绝对的必然,两种颜色石子的比率是3:2。
雅各布的计算显示,从罐子中取出2555枚石子后,则有大于1000/1001的概率使其结果与真实结果(3:2)间的差异在2%之内。也就是所谓的“接受必然的可能性”。
雅各布宣称,我们可以对任何不确定的数量进行科学的预测了。如果我们可以像“先知”一样,几乎能很准确地预言“事后”。

由于“大数法则”的极端重要性,1913年12月彼得堡科学院曾举行纪念大会,庆贺“大数法则”诞生200周年。
《猜度术》是概率论的第一部奠基性著作,所含概率思想具有划时代的重大意义,可谓对概率论做出了决定性的贡献,推进了概率论的进一步发展。因而其出版是概率论成为独立数学分支的标志。

posted on 2015-11-21 16:11  再不努力就死翘翘了  阅读(2239)  评论(0编辑  收藏  举报

导航