统计推断 复习笔记

期末速成 Day 2/2

目录

Ch1 概率论

image

Ch2 变换和期望

image
image

Ch3 常见分布族

image
image

Ch4 多维随机变量

image
image

Thm 4.6.11(多个随机向量独立)

image

Thm 4.6.12(多个随机向量独立 \(\Rightarrow\) 一元函数独立)

image

Ch5 随机样本的性质

5.1 随机样本的基本概念

Def

  • 随机样本
  • 总体\(x\sim f(x)\)

5.2 随机样本中随机变量的和

Def

  • 统计量\(Y=T(x_1,...,x_n)\)(不能是含参数的函数)
  • 抽样分布\(Y\) 的概率分布
  • 样本均值:随机样本值的算术平均 image
  • 样本方差image,样本标准差 \(S\)

Theorem 5.2.4

  • image
  • \(min_a\Sigma_{i=1}^n|x_i-a|=\Sigma_{i=1}^n|x_i-median(x_1,...,x_n)|\)

Lemma 5.2.5

  • image

Theorem 5.2.6(\(\overline X\)\(S^2\) 的无偏性)

  • image
  • 统计量 \(\overline X\)\(S^2\) 分别称为 \(\mu\)\(\sigma^2\)无偏估计量

Example 5.2.10(Cauchy 随机变量的和)

  • image
  • \(Cauchy(0,\sigma)+Cauchy(0,\tau)\sim Cauchy(0,\sigma+\tau)\)

5.3 正态分布的抽样

Theorem 5.3.1(正态分布下 \(\overline X\)\(S^2\) 的分布)

  • image

Lemma 5.3.2(关于 \(\chi^2\) 随机变量的若干事实)

  • image

正态随机变量的线性组合

Lemma 5.3.3

  • image
  • 对于由独立的正态随机变量的线性函数构成的随机变量,协方差等于 0 等价于独立。

导出分布:\(t\) 分布与 \(F\) 分布

略。

5.4 次序统计量

Def

  • 次序统计量\(X_{(1)},...,X_{(n)}\)
    image
  • 样本极差 \(R=X_{(n)}-X_{(1)}\)
  • 样本中程数 midrange \(M=\frac{1}{2}(X_{(1)}+X_{(n)})\)

Theorem 5.4.4(次序统计量的 pdf)

  • image

Example 5.4.5

  • image

Theorem 5.4.6(次序统计量的联合 pdf)

  • image

5.5 收敛的概念

依概率收敛

Def

  • 依概率收敛:image

Theorem 5.5.2(弱大数定律:样本均值依概率收敛于总体均值)

  • image

Example 5.5.3(\(S^2\) 的相合性:\(lim_{n\rightarrow +\infty}VarS_n^2=0 \Rightarrow S_n^2\) 依概率收敛于 \(\sigma^2\)

  • image

Thm 5.5.4(依概率收敛 \(\Rightarrow\) 连续函数依概率收敛)

  • image

几乎处处收敛

Def

  • 几乎处处收敛image (几乎处处收敛 \(\Rightarrow\) 依概率收敛)

Theorem 5.5.9(强大数定律:样本均值几乎处处收敛于整体均值)

  • image

依分布收敛

Def

  • 依分布收敛image

Theorem 5.5.12(依概率收敛于随机变量 \(\Rightarrow\) 依分布收敛)

  • image

Theorem 5.5.13(依概率收敛于常数 \(\Leftrightarrow\) 依分布收敛)

  • image

Theorem 5.5.15(中心极限定理:总体分布方差有限 \(\Rightarrow \sqrt n (\overline{X_n}-\mu)/\sigma\) 依概率收敛于 \(N(0,1)\)

  • image
  • 可以用于近似计算概率

Theorem 5.5.17(Slutsky 定理)

  • image
  • c. \(\frac{X_n}{Y_n}\rightarrow \frac{X}{C}\)

\(\triangle\) 方法

Theorem 5.5.24(\(\triangle\) 方法)

  • image

Theorem 5.5.26(二阶 \(\triangle\) 方法)

  • image

5.6 生成随机样本

直接法

  • image

间接法

  • image

舍选法

  • image

Ch6 数据简化原理

6.2 充分性原理

充分统计量

Def

  • 充分统计量:如果样本 \(X\) 在已知统计量 \(T(X)\) 取值时的条件分布 \(P\{X=x|T(X)=T(x)\}\)\(\theta\) 无关,则称 \(T(X)\) 为充分统计量。
    • 除指数族分布外,其它分布中少有维数低于样本大小的充分统计量,因此很多时候次序统计量已经是我们能找到的最好的充分统计量。

Theorem 6.2.6(因子分解定理)

  • image

Theorem 6.2.10(指数族总体的充分统计量)

  • image

极小充分统计量

Def

  • 极小充分统计量:称充分统计量 \(T(X)\) 是极小充分统计量,如果对其余任一充分统计量 \(T'(X)\)\(T(X)\) 都是 \(T'(X)\) 的函数。
    • image

Theorem 6.2.13(Lehman and Scheffe)

  • image

辅助统计量

Def

  • 辅助统计量:如果统计量 \(S(X)\) 的分布与 \(\theta\) 无关,则称它为辅助统计量。

Example 6.2.18-19(位置族、尺度族辅助统计量)

  • image
  • image

完全统计量

Def

  • 完全的概率分布族:设 \(f(x|\theta),\theta \in \Theta\)\(\{ P_\theta|\theta \in \Theta\}\) 是概率分布族,称 \(\{ P_\theta|\theta \in \Theta\}\) 是完全的,如果对 \(X\sim P_\theta\),若 \(E_\theta g(X)=\int g(x) dP_\theta(x)=0,\forall\theta\in\Theta\),则有 \(g(x)=0,a.e.\)
  • 完全统计量image
    image

Theorem 6.2.24(Basu 定理:极小充分统计量和任意辅助统计量独立的条件)

  • image

Theorem 6.2.25(指数族总体的完全统计量)

  • image

Ch7 点估计

7.2 求估计量的方法

Def

  • 点估计量:样本的任何一个函数 \(W(X_1,...,X_n)\)

Theorem(统计学基本定理)

  • \(X_1,...,X_n\stackrel{i.i.d.}{\sim} F(x)\),经验分布函数 \(F_n(x)=\frac{1}{n}\Sigma^n_{i=1}I(x_i≤x)\),则有 \(F_n(x)\stackrel{a.s.}{\rightarrow} F(x),\ \forall x\)

Def(矩估计)

  • 由统计学基本定理,若 \(|Eg(X)|<\infty\),可以取 \(\frac{1}{n}\Sigma_{i=1}^n g(x_i) \rightarrow Eg(x)=G(\theta)\) 作为 \(\theta\) 的估计。当取 \(g(x)=x^k\) 时,\(G_k(\theta)=E_\theta x^k:=\frac{1}{n}\Sigma_{i=1}^n x_i^k\) 称为 \(\theta\) 的矩估计。

最大似然估计

Def

  • 似然函数:若 \(X_1,...,X_n\stackrel{i.i.d.}{\sim} f(x|\theta),\ \theta \in \Theta\),则 \(L(\theta|x_1,...,x_n)=\Pi^n_{i=1}f(x_i|\theta)\) 称为似然函数。
  • 最大似然估计 MLEimage
    • 计算方法:算 \(L(\theta)\),求一阶导的零点,再求二阶导证明最大。

Theorem 7.2.10(最大似然估计的不变原理)

  • image

Bayes 估计

Def

  • 先验分布:在见到抽样数据之前,通过预先对 \(\theta\) 了解的信息,假设 \(\theta\sim \pi(\theta)\)
  • 后验分布:给定样本 \(x\) 的条件下 \(\theta\) 的条件分布,即 \(\pi(\theta|x)=\frac{f(x|\theta)\pi(\theta)}{m(x)}\),其中 \(m(x)\)\(x\) 的边缘分布,\(m(x)=\int f(x|\theta)\pi(\theta)d\theta\)
    • 可以利用后验分布 \(\pi(\theta|x)\)\(\theta\) 进行推断,比如取后验均值 \(\underset{\pi(\theta|x)}{E}\ \theta\),最大值 \(\underset{\theta}{max}\ \pi(\theta|x)\) 作为 \(\theta\) 的估计。

Example 7.2.14(二项分布的 Bayes 估计)

  • \(X_1,...,X_n\stackrel{i.i.d.}{\sim} Bernoulli(p)\),则 \(Y=\Sigma_{i=1}^n X_i\sim binomial(n,p)\)。假设 \(p\) 的先验分布是 Beta 分布,\(p\sim beta(\alpha,\beta)\),则后验分布 \(f(p|y)\sim beta(y+\alpha,n-y+\beta)\),用后验分布的均值估计 \(p\),得 \(\widehat p_B=\frac{y+\alpha}{\alpha+\beta+n}=(\frac{n}{\alpha+\beta+n})(\frac{y}{n})+(\frac{\alpha+\beta}{\alpha+\beta+n})(\frac{\alpha}{\alpha+\beta})\),为样本均值 \(\frac{y}{n}\) 和先验均值 \(\frac{\alpha}{\alpha+\beta}\) 的一个线性组合。

Example 7.2.16(正态分布的 Bayes 估计)

  • image
    image

7.3 估计量的评价方法

Def

  • 相合性:当 \(n\rightarrow +\infty\) 时,若 \(\widehat\theta_n \stackrel{P}{\rightarrow} \theta,\ \theta\in\Theta\),则称 \(\widehat\theta_n\)\(\theta\) 的(弱)相合估计。

均方误差

Def

  • 均方误差 MSE:参数 \(\theta\) 的估计量 \(\widehat\theta_n\) 的均方误差定义为 \(E|\widehat\theta_n-\theta|^2=Var(\widehat\theta_n)+(E\widehat\theta_n-\theta)^2\)
  • 偏倚 bias\(Bias(\widehat\theta_n)=E\widehat\theta_n-\theta\)
  • 无偏估计量:满足 \(Bias(\widehat\theta_n)=0\),即 \(E|\widehat\theta_n-\theta|^2=Var(\widehat\theta_n)\)

UMVUE

Def

  • 一致最小方差无偏估计量 UMVUEimage

Theorem 7.3.9(Cramer-Rao不等式:估计量方差下界)

  • image
    image
  • \(W(X)\)\(\tau(\theta)\) 的无偏估计,则 \(E_\theta W(X)=\tau(\theta)\)。上式等号成立当且仅当存在 \(c(\theta),d(\theta)\),使得 \(W(X)-\tau(\theta)=d(\theta)(\frac{\partial}{\partial \theta}\log f(x|\theta))\)
  • image
    • 一般来说,若概率密度函数 \(f(x|\theta)\) 不等于零的范围(支撑集)依赖于参数,该定理将不再适用。
    • Fisher 信息量 \(I(\theta)=E_\theta ((\frac{\partial}{\partial \theta}\log f(x|\theta))^2)\)

UMVUE 与充分统计量

Lemma

  • image

Theorem 7.3.17(Rao-Blackwell:利用充分统计量获得更好的无偏估计)

  • image

Theorem 7.3.19(UMVUE 的唯一性)

  • image
    • 证明思路:Cauchy-Schwarz 不等式

Theorem 7.3.20

  • image
  • 即:若 \(W\) 是 UMVUE,那么 \(Cov_\theta(W,U)=0,\ \forall\theta,\ \forall U\) 满足 \(E_\theta U=0\)

Theorem 7.3.23

  • \(X_1,...,X_n\stackrel{i.i.d.}{\sim} f(x|\theta),\ \theta\in\Theta\)\(W(x)\)\(\tau(\theta)\) 的一个无偏估计,\(T(x)\) 是一个充分完全统计量,则 \(E(W|T)\)\(\tau(\theta)\) 的 UMVUE。

Ch8 假设检验

Def

  • 假设:关于总体参数的一个陈述。
  • 原假设 \(H_0\)备择假设 \(H_1\):一个假设检验问题中两个互补的假设,一般格式是 \(H_0:\theta\in\Theta_0\)\(H_1:\theta\in\Theta_0^C\)
  • 假设检验:收集样本 \(X=(X_1,...,X_n)\),制定规则来判断 \(H_0\)\(H_1\) 的真伪。当 \(x\in R\) 时,拒绝 \(H_0\);否则,接受 \(H_0\).
  • 拒绝域\(R\)

8.2 检验的求法

似然比检验

Def

  • 似然比检验 LRT
    image
    image

Theorem 8.2.4

  • image

Bayes 检验

Def

  • Bayes 检验:结合抽样分布 \(f(x|\theta)\) 和先验分布 \(\pi(\theta)\),我们可以得到后验分布 \(\pi(\theta|x)\),所有关于 \(\theta\) 的推断都基于后验分布进行。拒绝域 \(R:=\{X\ |\ \mathbb P(\theta\in\Theta_0|X)<\mathbb P(\theta\in\Theta_0^C|X)\}=\{X\ |\ \mathbb P(\theta\in\Theta_0|X)<\frac{1}{2}\}\)

并-交检验和交-并检验

Def

  • 并-交检验
    image
    image

  • 交-并检验
    image
    image

8.3 检验的评价方法

错误概率与功效函数

Def

  • 第一类错误\(H_0\) 成立,但是 \(x\in R\)(拒绝 \(H_0\)
  • 第二类错误\(H_0^C\) 成立,但是 \(x\in R^C\)(拒绝 \(H_0^C\)

image

  • 功效函数\(\beta(\theta)=\mathbb P_\theta(x\in R)\)
  • 真实水平/水平
    image

无偏检验

Def

  • 无偏检验
    image

  • 一致最大功效(UMP)检验
    image

Theorem 8.3.12(Neyman-Pearson 引理)

  • image
  • image

Ch9 区间估计

Def

  • 区间估计
    image
    • 区间可以为闭、开、半开半闭,\(L(x)\)\(U(x)\) 可以取 \(\pm\infty\)
  • 覆盖率 CP\(\mathbb P_\theta(\theta\in[L(X),U(X)])\)
    • 陈述是针对 \(X\) 而非 \(\theta\)
  • 置信系数\(\inf_\theta \mathbb P_\theta(\theta\in[L(X),U(X)])\)
  • 置信区间:区间估计量 + 置信系数

9.2 区间估计量的求法

  • 评价标准:限定 \(\inf_\theta \mathbb P_\theta(\theta\in[L(X),U(X)])=1-\alpha,\ \alpha>0\),使得 \(E(U(X)-L(X))\) 达到最小值。

枢轴量法

Def

  • 枢轴量\(Q(X_1,...,X_n,\theta)=Q(T(X),\theta)\)\(X_1,...,X_n,\theta\) 有关,但它的分布与 \(\theta\) 无关,这样的 \(Q\) 被称为枢轴量。

Example 9.2.7(位置-尺度枢轴)

  • image
  • image
posted @ 2023-11-12 23:43  SELFLOVER  阅读(437)  评论(0编辑  收藏  举报