网站更新内容:请访问: https://bigdata.ministep.cn/

统计学基础--大数定律、中心极限定理

一、大数定律

统计规律性

  • 多次抛掷硬币,正面向上出现的频率接近1/2
  • 人口男女比例接近1:1

在随机事件的大量重复出现,往往呈现几乎必然的规律,这类规律就是大数定律

1.1 切比雪夫不等式

1.2弱大数定律

弱大数定律的意义:

1.2伯努利大数定律

伯努利大数定律的意义:

  • 伯努利大数定律的结论虽然简单,但其意义却是相当深刻的.它告诉我们当试验次数趋于无穷时,事件A发生的频率依概率收敛于A发生的概率,这样,频率接近于概率这一直观的经验就有了严格的数学意义
  • 在实际应用中,当试验次数很大时,便可以用事件的频率来代替事件的概率。例如:

某个箱子里装有若干个白球和红球,具体比例不知道。若从中做1000次有放回抽样,抽出红球100个,白球900个,则我们可以说抽出红球的概率是100/1000=0.1

 

二、中心极限定理

2.1 独立同分布的中心极限定理(独立同分布近似正态分布)

定理说明:n 个相互独立同分布的随机变量之和的分布近似于正态分布,n 愈大,此种近似度愈好

2.2 Lyapunov定理(任何分布近似正态分布)

定理说明:

实际应用举例:

如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和,从而可以知道这

个城市的耗电量服从正态分布。

 

2.3 Laplace 定理(二项分布近似正态分布)

三、总结

3.1 大数定律小结

大数定律说明了:只要统计的数据量足够多,事物出现的频率就无限接近于其期望值

3.2 中心极限定理小结

3.2.1中心极限定理说明了什么?

  • 任何一个样本的平均值将会约等于其所在总体的平均值
  • 无论总体是什么分布,任意一个总体的样本平均值都会在总体的平均值周围,呈现正态分布

3.2.2 中心极限定理有什么用?

  • 在无法得到总体全部数据的情况下,可以使用样本来估计总体

例如:我们掌握了某个正确抽取样本的平均值和标准差,就能对估计出总体的平均值和标准差。

  • 根据总体的平均值和标准差,判断某个样本是否属于总体

例如:我们掌握了某个总体的具体信息,以及某个样本的数据,就能推理出该样本是否就是该群体的样本之一。通过中心极限定理的正态分布,我们就能计算出某个样本属于总体的概率是多少。如果概率非常低,那么我们就能自信满满地说该样本不属于该群体。这也是统计概率中假设检验的原理。

posted @ 2022-03-02 14:16  ministep88  阅读(736)  评论(0编辑  收藏  举报
网站更新内容:请访问:https://bigdata.ministep.cn/