概率笔记9——大数定律

　　在随机事件的大量重复出现中，往往呈现几乎必然的规律，这个规律就是大数定律。

　　当我们掷一枚硬币时，说正面朝上的概率是1/2，是这样吗？当你掷十次硬币时，正面朝上的概率可未必是1/2，这个结果带有很强的随机性，并没有什么规律可言。但是当投掷的次数足够多时，规律就呈现出来了。概率研究的是随机现象背后的客观规律，当试验次数趋*于无穷时，正面朝上的频率收敛于1/2概率。

　　大数定律是概率论中讨论随机变量序列的算术*均值向随机变量各数学期望的算术*均值收敛的定律。我觉得还是不要计较概念，关注实际例子就好。

　　以斗地主为例，玩家的水*有高有低，但每个人都有一个真实水*，衡量真实水*的数字特征就是获胜的数学期望。然而高手也不见得每次都会获胜，因为除了实力外，运气也占有很大比重，顶尖高手面对一手烂牌也会束手无策。我们并不能以一局的输赢判断某个人打牌的水*高低，此时运气带来的影响会放大，也就是随机性太大，但是随着打牌的次数增多，高手的成绩会渐渐趋于稳定，他赢的次数会渐渐符合他的真实水*，此时随机性背后的客观规律会逐渐显现出来。

　　我们用一段程序模拟大数定律。这段程序在1~10中随便抽取n个数，然后计算*均值：

 1 import numpy as np
 2 import pandas as pd
 3 from matplotlib import pyplot as plt
 4 
 5 results = []
 6 for n in range(1, 10000):
 7     nums = np.random.randint(low=1, high=10, size=n)
 8     results.append(nums.mean())
 9 
10 df = pd.DataFrame({'均值': results})
11 df.plot()
12 plt.rcParams['font.sans-serif'] = ['SimHei'] 
13 plt.xlabel('样本数量')
14 plt.ylabel('样本均值')
15 plt.show()

　　可以看到，随着样本的增多，均值逐渐趋*于*稳，随机性对均值的影响也越来越小。

　　以下内容是从保险不是碰运气(大数法则) （https://www.jianshu.com/p/f384357a554d）上抄来的：

　　根据以往的经验，某类汽车每年的损失概率约为2‰，相应的，在收保费时也会按这个损失比例收取。这时，我们可以把一投保的该类汽车看作一次抛硬币或一次掷骰子，如果投保的汽车数量很少，则相当于抛硬币和掷骰子实验中抛掷的次数很少，那么投保的汽车实际发生事故几率与预先估计的2‰，这个比例可能相差较远，对于保险公司而言则容易发生赔付危机；相反，如果有许许多多的车辆投保该保险，就相当于上面实验中抛掷次数相当多，那么实际的事故发生状况当然就会更接*保险公司估计的2‰，这一损失比例，保险公司就不会担心发生赔付危机了。

　　大数定律的实质就在于，通过集合众多性质相同或相*的风险，把单个风险的不确定性变成集体风险的可测性，从而达到分散风险的目的。其实，一家保险公司承保的业务再少，也可以通过再保险制度将全世界的同类业务联系起来，也符合大数定律的要求。

　　有了大数定律这一科学原理，保险公司在保证大量标的存在的前提下，可以预先估计来年将会发生多少事故，并提前做好准备。所以，不用担心，保险公司是真的很“保险”，并不是在碰运气。

　　作者：我是8位的

　　出处：http://www.cnblogs.com/bigmonke

　　本文以学习、研究和分享为主，如需转载，请联系本人，标明作者和出处，非商业用途！

　　扫描二维码关注公作者众号“我是8位的”

posted on 2019-06-28 14:56 我是8位的阅读(2441) 评论(0) 收藏举报

刷新页面返回顶部

我是8位的

概率笔记9——大数定律

导航

公告