正态分布与中心极限定理
正态分布
定义
正态分布(英语:normal distribution)又名高斯分布(英语:Gaussian distribution),是一个非常常见的连续概率分布。正态分布在统计学上十分重要,经常用在自然和社会科学来代表一个不明的随机变量。
也就是说,正态分布一种分布形式,它实际上有很多表示形式,最常见的有概率密度函数,累计分布函数等等来表示。
在OI界出过的也仅有概率密度函数因为其他的我没听说过
概率密度公式
设期望为$\mu$,方差为$\sigma$
则有$f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e ^ {-\frac{(x-\mu)^2}{2 \sigma^2}}$
$f(x)$表示该点出现的概率
如果一个随机变量$X$服从这个分布,我们写作$X \sim N(\mu, \sigma)$
特殊的,如果$\mu = 0, \sigma = 1$,这个分布被称为标准正态分布
中心极限定理
简介
中心极限定理是概率论中的一组定理。中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量之和近似服从正态分布的条件。
关于中心极限定理,有很多延伸版本,它们大都证明了某一种实验以某一种正态分布为极限,具体也没啥多大的用处,想学的自己维基吧qwq
推论
中心极限定理有一个非常重要的推论。
若有$N$个独立同分布的随机变量$x_1, x_2, \dots, x_n$
期望为$\mu$,方差为$\sigma$
那么设
$$Y_n = \frac{\sum_{i = 1}^n x_i - n\mu}{\sqrt{n \sigma^2}}$$
当$n$足够大时,我们认为$Y_n$服从标准正态分布
这玩意儿有什么用呢?
比如说我们要对某个$f(x)$进行积分,它可能会造成非常大的精度误差
转成标准正态分布可以有效的降低误差
具体做法是:首先对我们要积分的区间$(L, R)$进行转化,再对转化出来的两个$Y_n$对应的区间积分