AI探索: 中心极限定理

中心极限定理介绍

中心极限定理(Central Limit Theorem, CLT)是统计学中的一个基本定理,它描述了在一定条件下,独立随机变量的平均值(或和)的分布会趋近于正态分布,无论这些随机变量的原始分布是什么样的。换句话说,只要样本量足够大,样本均值的分布会近似正态分布。

数学表述

假设我们有 \(n\) 个独立同分布(i.i.d.)的随机变量 \(X_1, X_2, \dots, X_n\),它们的均值为 \(\mu\),方差为 \(\sigma^2\)。定义样本均值为:

\[\bar{X} = \frac{X_1 + X_2 + \dots + X_n}{n} \]

根据中心极限定理,当 \(n\) 趋于无穷大时,\(\bar{X}\) 的分布近似于正态分布:

\[\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) \]

这里的 \(\frac{\sigma^2}{n}\) 是样本均值的方差。

条件

  • 随机变量需独立且同分布。
  • 样本量 \(n\) 足够大(通常 \(n \geq 30\) 被认为是一个经验阈值,但具体取决于原始分布)。
  • 原始分布的方差 \(\sigma^2\) 需有限。

例子

假设你在掷一个六面骰子(均匀分布),每次掷骰子的结果是一个随机变量 \(X\),取值范围为 \(\{1, 2, 3, 4, 5, 6\}\)。单个掷骰子的均值 \(\mu\) 和方差 \(\sigma^2\) 计算如下:

  • 均值:\(\mu = \frac{1 + 2 + 3 + 4 + 5 + 6}{6} = 3.5\)
  • 方差:\(\sigma^2 = \frac{(1-3.5)^2 + (2-3.5)^2 + \dots + (6-3.5)^2}{6} = \frac{17.5}{6} \approx 2.9167\)

现在,假设你每次实验掷 \(n=50\) 次骰子,并计算这 \(50\) 次的平均值 \(\bar{X}\)。根据中心极限定理,\(\bar{X}\) 的分布会近似于:

\[\bar{X} \sim N\left(3.5, \frac{2.9167}{50}\right) \approx N(3.5, 0.0583) \]

这意味着样本均值 \(\bar{X}\) 将围绕 \(3.5\) 波动,且标准差为 \(\sqrt{0.0583} \approx 0.241\)。如果重复多次这样的实验,\(\bar{X}\) 的值会呈现钟形曲线(正态分布)的特征,而不是原始的均匀分布。

实际意义

中心极限定理解释了为什么正态分布在现实中如此常见。例如,测量误差、人的身高、体重等往往是许多小因素的叠加结果,因此它们的分布趋向于正态分布。这也是统计推断中许多方法(如 t 检验)的基础。

希望这个例子清楚地展示了中心极限定理的威力!

期望和方差的数学公式与例子

期望(Expected Value)

数学定义

期望表示随机变量的平均值或"中心位置"。

离散随机变量的期望

如果 \(X\) 是一个离散随机变量,其可能的取值为 \(x_1, x_2, ..., x_n\),对应的概率为 \(P(X = x_i) = p_i\),则 \(X\) 的期望值定义为:

\[E[X] = \sum_{i=1}^{n} x_i p_i \]

连续随机变量的期望

如果 \(X\) 是一个连续随机变量,概率密度函数为 \(f(x)\),则 \(X\) 的期望值定义为:

\[E[X] = \int_{-\infty}^{\infty} x f(x) dx \]

期望的性质

  1. 常数的期望等于常数本身:\(E[c] = c\)
  2. 线性性质:\(E[aX + b] = aE[X] + b\)
  3. 独立随机变量的乘积期望:如果 \(X\)\(Y\) 独立,则 \(E[XY] = E[X] \cdot E[Y]\)
  4. 期望的加法性:\(E[X + Y] = E[X] + E[Y]\)(无需独立性假设)

期望的例子

例1:投掷公平骰子

投掷一个公平的六面骰子,求点数的期望值。

解决方案:
骰子的可能结果为1, 2, 3, 4, 5, 6,每个结果的概率均为1/6。

\[E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{21}{6} = 3.5 \]

例2:二项分布

假设进行n=10次伯努利试验,每次成功概率p=0.3,求成功次数X的期望值。

解决方案:
X服从参数为n=10和p=0.3的二项分布,其期望为:

\[E[X] = n \cdot p = 10 \cdot 0.3 = 3 \]

例3:标准正态分布

计算标准正态分布随机变量的期望值。

解决方案:
标准正态分布密度函数为:\(f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}\)

\[E[X] = \int_{-\infty}^{\infty} x \cdot \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = 0 \]

由于标准正态分布的密度函数是偶函数(关于y轴对称),所以期望值为0。

方差(Variance)

数学定义

方差度量随机变量取值的分散程度,即随机变量偏离其期望值的程度。

\[Var[X] = E[(X - E[X])^2] \]

方差也可以通过下面的公式计算:

\[Var[X] = E[X^2] - (E[X])^2 \]

离散随机变量的方差

\[Var[X] = \sum_{i=1}^{n} (x_i - E[X])^2 p_i \]

\[Var[X] = \sum_{i=1}^{n} x_i^2 p_i - \left(\sum_{i=1}^{n} x_i p_i\right)^2 \]

连续随机变量的方差

\[Var[X] = \int_{-\infty}^{\infty} (x - E[X])^2 f(x) dx \]

\[Var[X] = \int_{-\infty}^{\infty} x^2 f(x) dx - \left(\int_{-\infty}^{\infty} x f(x) dx\right)^2 \]

方差的性质

  1. 常数的方差为零:\(Var[c] = 0\)
  2. 缩放性质:\(Var[aX] = a^2 Var[X]\)
  3. 平移不改变方差:\(Var[X + b] = Var[X]\)
  4. 独立随机变量的和的方差:如果 \(X\)\(Y\) 独立,则 \(Var[X + Y] = Var[X] + Var[Y]\)

方差的例子

例1:投掷公平骰子

计算投掷公平六面骰子的点数的方差。

解决方案:
已知 \(E[X] = 3.5\)

使用公式:\(Var[X] = E[X^2] - (E[X])^2\)

首先计算 \(E[X^2]\):

\[E[X^2] = 1^2 \cdot \frac{1}{6} + 2^2 \cdot \frac{1}{6} + 3^2 \cdot \frac{1}{6} + 4^2 \cdot \frac{1}{6} + 5^2 \cdot \frac{1}{6} + 6^2 \cdot \frac{1}{6} \]

\[E[X^2] = \frac{1 + 4 + 9 + 16 + 25 + 36}{6} = \frac{91}{6} \approx 15.17 \]

然后计算方差:

\[Var[X] = E[X^2] - (E[X])^2 = \frac{91}{6} - (3.5)^2 = \frac{91}{6} - \frac{49}{4} = \frac{91}{6} - \frac{73.5}{6} = \frac{17.5}{6} \approx 2.92 \]

例2:二项分布

计算参数为n=10和p=0.3的二项分布的方差。

解决方案:
二项分布的方差公式为:\(Var[X] = n \cdot p \cdot (1-p)\)

\[Var[X] = 10 \cdot 0.3 \cdot (1-0.3) = 10 \cdot 0.3 \cdot 0.7 = 2.1 \]

例3:标准正态分布

计算标准正态分布的方差。

解决方案:
标准正态分布的密度函数为:\(f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}\)

标准正态分布的方差为1(这是由定义确定的)。可以通过积分验证:

\[Var[X] = \int_{-\infty}^{\infty} x^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx - 0^2 = 1 \]

例4:均匀分布

计算区间[0,1]上的均匀分布的期望和方差。

解决方案:
均匀分布的密度函数为:\(f(x) = 1\)\(x \in [0,1]\)

期望:

\[E[X] = \int_{0}^{1} x \cdot 1 dx = \left. \frac{x^2}{2} \right|_{0}^{1} = \frac{1}{2} \]

方差:

\[E[X^2] = \int_{0}^{1} x^2 \cdot 1 dx = \left. \frac{x^3}{3} \right|_{0}^{1} = \frac{1}{3} \]

\[Var[X] = E[X^2] - (E[X])^2 = \frac{1}{3} - \left(\frac{1}{2}\right)^2 = \frac{1}{3} - \frac{1}{4} = \frac{1}{12} \approx 0.0833 \]

期望和方差的实际应用

  1. 投资分析:期望代表投资的平均回报率,方差表示风险的大小
  2. 质量控制:期望表示产品的平均质量,方差表示质量的一致性
  3. 机器学习:期望和方差用于评估模型性能(偏差-方差权衡)
  4. 统计检验:用于构建置信区间和假设检验
  5. 信号处理:期望代表信号的平均强度,方差表示噪声水平

期望和方差是概率论和统计学中最基本也最重要的概念,构成了分析随机现象的基础工具。

找到具有 1 个许可证类型的类似代码

方差公式的数学推导

方差有两种常用公式:

  1. 定义式:\(\text{Var}[X] = E[(X - E[X])^2]\)
  2. 计算式:\(\text{Var}[X] = E[X^2] - (E[X])^2\)

下面我们详细推导这两个公式之间的等价关系,并解释方差的数学含义。

从定义式到计算式的推导

我们从方差的定义式开始:

\[\text{Var}[X] = E[(X - E[X])^2] \]

展开平方项:

\[\text{Var}[X] = E[X^2 - 2X \cdot E[X] + (E[X])^2] \]

利用期望的线性性质,可以将上式拆分:

\[\text{Var}[X] = E[X^2] - E[2X \cdot E[X]] + E[(E[X])^2] \]

进一步简化,注意 \(E[X]\) 是一个常数:

\[\text{Var}[X] = E[X^2] - 2E[X] \cdot E[X] + (E[X])^2 \]

合并第二项和第三项:

\[\text{Var}[X] = E[X^2] - 2(E[X])^2 + (E[X])^2 \]

进一步简化:

\[\text{Var}[X] = E[X^2] - (E[X])^2 \]

这就得到了方差的计算公式。

离散随机变量的详细推导

对于离散随机变量 \(X\),其可能的取值为 \(x_1, x_2, ..., x_n\),对应的概率为 \(P(X = x_i) = p_i\)

步骤1:期望的计算

\[E[X] = \sum_{i=1}^{n} x_i p_i \]

步骤2:平方项的期望

\[E[X^2] = \sum_{i=1}^{n} x_i^2 p_i \]

步骤3:代入方差公式

根据方差公式 \(\text{Var}[X] = E[X^2] - (E[X])^2\)

\[\text{Var}[X] = \sum_{i=1}^{n} x_i^2 p_i - \left(\sum_{i=1}^{n} x_i p_i\right)^2 \]

步骤4:直接从定义计算

也可以直接使用定义式计算:

\[\text{Var}[X] = E[(X - E[X])^2] = \sum_{i=1}^{n} (x_i - E[X])^2 p_i \]

连续随机变量的详细推导

对于连续随机变量 \(X\),其概率密度函数为 \(f(x)\)

步骤1:期望的计算

\[E[X] = \int_{-\infty}^{\infty} x f(x) dx \]

步骤2:平方项的期望

\[E[X^2] = \int_{-\infty}^{\infty} x^2 f(x) dx \]

步骤3:代入方差公式

\[\text{Var}[X] = E[X^2] - (E[X])^2 = \int_{-\infty}^{\infty} x^2 f(x) dx - \left(\int_{-\infty}^{\infty} x f(x) dx\right)^2 \]

步骤4:直接从定义计算

\[\text{Var}[X] = E[(X - E[X])^2] = \int_{-\infty}^{\infty} (x - E[X])^2 f(x) dx \]

通过具体例子验证两种方法的等价性

例子:离散随机变量

考虑随机变量 \(X\) 的分布为:

\(X\) 1 2 3
\(P(X)\) 0.2 0.5 0.3

方法1:使用 \(E[X^2] - (E[X])^2\)

计算 \(E[X]\):

\[E[X] = 1 \times 0.2 + 2 \times 0.5 + 3 \times 0.3 = 0.2 + 1.0 + 0.9 = 2.1 \]

计算 \(E[X^2]\):

\[E[X^2] = 1^2 \times 0.2 + 2^2 \times 0.5 + 3^2 \times 0.3 = 0.2 + 2.0 + 2.7 = 4.9 \]

计算方差:

\[\text{Var}[X] = E[X^2] - (E[X])^2 = 4.9 - (2.1)^2 = 4.9 - 4.41 = 0.49 \]

方法2:使用 \(E[(X - E[X])^2]\)

\[\begin{align*} \text{Var}[X] &= E[(X - E[X])^2] \\ &= (1 - 2.1)^2 \times 0.2 + (2 - 2.1)^2 \times 0.5 + (3 - 2.1)^2 \times 0.3 \\ &= (-1.1)^2 \times 0.2 + (-0.1)^2 \times 0.5 + (0.9)^2 \times 0.3 \\ &= 1.21 \times 0.2 + 0.01 \times 0.5 + 0.81 \times 0.3 \\ &= 0.242 + 0.005 + 0.243 \\ &= 0.49 \end{align*}\]

两种方法得到相同结果,验证了公式的等价性。

例子:连续随机变量

考虑区间 \([0,1]\) 上的均匀分布 \(U(0,1)\)

方法1:使用 \(E[X^2] - (E[X])^2\)

计算 \(E[X]\):

\[E[X] = \int_{0}^{1} x \cdot 1 dx = \left[ \frac{x^2}{2} \right]_{0}^{1} = \frac{1}{2} \]

计算 \(E[X^2]\):

\[E[X^2] = \int_{0}^{1} x^2 \cdot 1 dx = \left[ \frac{x^3}{3} \right]_{0}^{1} = \frac{1}{3} \]

计算方差:

\[\text{Var}[X] = E[X^2] - (E[X])^2 = \frac{1}{3} - \left(\frac{1}{2}\right)^2 = \frac{1}{3} - \frac{1}{4} = \frac{1}{12} \approx 0.0833 \]

方法2:使用 \(E[(X - E[X])^2]\)

\[\begin{align*} \text{Var}[X] &= E[(X - E[X])^2] \\ &= \int_{0}^{1} \left(x - \frac{1}{2}\right)^2 \cdot 1 dx \\ &= \int_{0}^{1} \left(x^2 - x + \frac{1}{4}\right) dx \\ &= \left[ \frac{x^3}{3} - \frac{x^2}{2} + \frac{x}{4} \right]_{0}^{1} \\ &= \frac{1}{3} - \frac{1}{2} + \frac{1}{4} \\ &= \frac{4}{12} - \frac{6}{12} + \frac{3}{12} \\ &= \frac{1}{12} \approx 0.0833 \end{align*}\]

两种方法再次得到相同结果。

方差的数学意义

方差提供了随机变量分散程度的度量:

  1. 零方差:表示随机变量取值为常数,没有不确定性
  2. 小方差:表示随机变量的取值集中在期望附近
  3. 大方差:表示随机变量的取值远离期望,分布更加分散

从几何角度看,方差可以被解释为随机变量X相对于其期望值的"惯性矩"。如果我们把随机变量的概率分布视为质量分布,期望是"质心"位置,那么方差就是这个分布绕质心的转动惯量。

方差的平方根被称为标准差,提供了与原始变量同单位的离散程度度量,更便于直接解释。

方差的其他重要性质

  1. 平移不变性\(\text{Var}[X + c] = \text{Var}[X]\)

    证明:

    \[\begin{align*} \text{Var}[X + c] &= E[((X + c) - E[X + c])^2] \\ &= E[((X + c) - (E[X] + c))^2] \\ &= E[(X - E[X])^2] \\ &= \text{Var}[X] \end{align*}\]

  2. 缩放性质\(\text{Var}[aX] = a^2 \text{Var}[X]\)

    证明:

    \[\begin{align*} \text{Var}[aX] &= E[((aX) - E[aX])^2] \\ &= E[((aX) - (aE[X]))^2] \\ &= E[(a(X - E[X]))^2] \\ &= E[a^2(X - E[X])^2] \\ &= a^2 E[(X - E[X])^2] \\ &= a^2 \text{Var}[X] \end{align*}\]

  3. 独立随机变量的和的方差:如果X和Y独立,则\(\text{Var}[X + Y] = \text{Var}[X] + \text{Var}[Y]\)

    证明:使用\(\text{Var}[X] = E[X^2] - (E[X])^2\)公式

    \[\begin{align*} \text{Var}[X + Y] &= E[(X + Y)^2] - (E[X + Y])^2 \\ &= E[X^2 + 2XY + Y^2] - (E[X] + E[Y])^2 \\ &= E[X^2] + 2E[XY] + E[Y^2] - (E[X])^2 - 2E[X]E[Y] - (E[Y])^2 \end{align*}\]

    由于X和Y独立,\(E[XY] = E[X]E[Y]\),代入得:

    \[\begin{align*} \text{Var}[X + Y] &= E[X^2] + 2E[X]E[Y] + E[Y^2] - (E[X])^2 - 2E[X]E[Y] - (E[Y])^2 \\ &= E[X^2] - (E[X])^2 + E[Y^2] - (E[Y])^2 \\ &= \text{Var}[X] + \text{Var}[Y] \end{align*}\]

理解方差的推导过程不仅帮助我们正确计算方差,还让我们深入理解随机变量的统计特性,为概率论和统计学的进一步学习打下基础。

找到具有 1 个许可证类型的类似代码

方差计算中概率密度函数的使用

在方差公式中,\(E(X^2)\) 的计算确实是用 \(X\) 的概率密度函数而不是 \(X^2\) 的概率密度函数,这是有理论依据的。

期望的基本定义

对于任意随机变量 \(X\) 和函数 \(g(X)\),期望 \(E[g(X)]\) 的计算公式为:

  • 离散情况:\(E[g(X)] = \sum_{i} g(x_i) \cdot P(X = x_i)\)
  • 连续情况:\(E[g(X)] = \int g(x) \cdot f_X(x) dx\)

其中 \(f_X(x)\) 是随机变量 \(X\) 的概率密度函数。

为什么不用 \(X^2\) 的概率密度?

当我们计算 \(E(X^2)\) 时,这里的 \(g(X) = X^2\)。按照期望的定义,我们直接使用 \(X\) 的概率密度函数,而不需要推导出 \(X^2\) 的概率密度函数。

也就是说:\(E(X^2) = \int x^2 \cdot f_X(x) dx\)

使用变换后随机变量的概率密度是否等价?

理论上,如果你令 \(Y = X^2\),并推导出 \(Y\) 的概率密度函数 \(f_Y(y)\),然后计算 \(E(Y) = \int y \cdot f_Y(y) dy\),结果应该与直接计算 \(E(X^2)\) 相同。

但实际操作中:

  1. 直接使用 \(X\) 的概率密度计算 \(E[g(X)]\) 通常更简单直接
  2. 推导 \(g(X)\) 的概率密度可能会很复杂
  3. 变量替换需要考虑雅可比行列式等因素

举例说明

假设 \(X \sim N(0,1)\) 是标准正态分布:

  • 直接计算:\(E(X^2) = \int_{-\infty}^{\infty} x^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = 1\)

  • 如果通过 \(Y = X^2\) 的概率密度来计算:

    • 需要先推导 \(Y\) 的概率密度函数(卡方分布)
    • 然后计算 \(E(Y)\)
    • 过程更加复杂

总结来说,对于 \(E[g(X)]\) 的计算,直接使用 \(X\) 的概率密度是标准方法,理论上也可以使用 \(g(X)\) 的概率密度,但通常不这么做,除非有特殊需求。

使用变换后随机变量的概率密度计算期望值

理论推导

假设有随机变量 \(X\) 及其概率密度函数 \(f_X(x)\),我们想要计算 \(g(X)\) 的期望值。

如果定义 \(Y = g(X)\),则 \(Y\) 是一个新的随机变量,其期望值可以通过两种方式计算:

方法一:直接使用 \(X\) 的概率密度函数

\[E[g(X)] = \int g(x) \cdot f_X(x) dx \]

方法二:使用 \(Y\) 的概率密度函数

我们需要推导出 \(Y = g(X)\) 的概率密度函数 \(f_Y(y)\),然后:

\[E[Y] = \int y \cdot f_Y(y) dy \]

要得到 \(f_Y(y)\),常用的方法是先求出 \(Y\) 的累积分布函数 \(F_Y(y)\),然后求导:

\[F_Y(y) = P(Y \leq y) = P(g(X) \leq y) \]

对于单调函数 \(g(X)\),可以用变量变换的方法:

  • \(g\) 是严格单调增函数:\(F_Y(y) = P(X \leq g^{-1}(y)) = F_X(g^{-1}(y))\)
  • \(g\) 是严格单调减函数:\(F_Y(y) = P(X \geq g^{-1}(y)) = 1-F_X(g^{-1}(y))\)

然后求导得到 \(f_Y(y) = \frac{dF_Y(y)}{dy}\)

对于非单调函数,需要分段处理或使用雅可比矩阵。

实际例子:计算 \(E(X^2)\) 其中 \(X \sim N(0,1)\)

方法一:直接法

\[E[X^2] = \int_{-\infty}^{\infty} x^2 \cdot \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = 1 \]

方法二:通过 \(Y = X^2\) 的概率密度计算

  1. 首先,\(Y = X^2\) 是非负的,所以 \(F_Y(y) = 0\)\(y < 0\)

  2. 对于 \(y \geq 0\):

    \[F_Y(y) = P(X^2 \leq y) = P(-\sqrt{y} \leq X \leq \sqrt{y}) = F_X(\sqrt{y}) - F_X(-\sqrt{y}) \]

  3. \(F_Y(y)\) 求导得到 \(f_Y(y)\):

    \[f_Y(y) = \frac{d}{dy}[F_X(\sqrt{y}) - F_X(-\sqrt{y})] \]

    \[= f_X(\sqrt{y}) \cdot \frac{1}{2\sqrt{y}} + f_X(-\sqrt{y}) \cdot \frac{1}{2\sqrt{y}} \]

  4. 代入标准正态分布密度函数:

    \[f_Y(y) = \frac{1}{2\sqrt{y}} \cdot \frac{1}{\sqrt{2\pi}} e^{-y/2} + \frac{1}{2\sqrt{y}} \cdot \frac{1}{\sqrt{2\pi}} e^{-y/2} \]

    \[= \frac{1}{\sqrt{2\pi y}} e^{-y/2} \]

    这是自由度为1的卡方分布的密度函数。

  5. 计算期望:

    \[E[Y] = \int_0^{\infty} y \cdot \frac{1}{\sqrt{2\pi y}} e^{-y/2} dy = 1 \]

结论

两种方法得到的结果是相同的,但第二种方法通常更复杂,需要额外的步骤来推导变换后随机变量的概率密度函数。对于复杂的函数 \(g(X)\),尤其是非单调函数,使用 \(X\) 的原始概率密度函数计算 \(E[g(X)]\) 往往更直接、更简单。

然而,在某些情况下,如果我们已经知道 \(g(X)\) 的概率分布(如常见的统计分布),使用第二种方法可能会更简便。

posted @ 2025-03-19 09:29  ffl  阅读(56)  评论(0)    收藏  举报