统计推断复习笔记

期末速成 Day 2/2

Ch1 概率论
Ch2 变换和期望
Ch3 常见分布族
Ch4 多维随机变量
- - - Thm 4.6.11（多个随机向量独立）
    - Thm 4.6.12（多个随机向量独立 \(\Rightarrow\) 一元函数独立）
Ch5 随机样本的性质
Ch6 数据简化原理
- 6.2 充分性原理
Ch7 点估计
- 7.2 求估计量的方法
- 7.3 估计量的评价方法
Ch8 假设检验
Ch9 区间估计
- - - Def
- 9.2 区间估计量的求法
  - 枢轴量法
    - Def
    - Example 9.2.7（位置-尺度枢轴）

Ch1 概率论

Ch2 变换和期望

Ch3 常见分布族

Ch4 多维随机变量

Thm 4.6.11（多个随机向量独立）

Thm 4.6.12（多个随机向量独立 \(\Rightarrow\) 一元函数独立）

Ch5 随机样本的性质

5.1 随机样本的基本概念

Def

随机样本
总体：\(x\sim f(x)\)

5.2 随机样本中随机变量的和

Def

统计量：\(Y=T(x_1,...,x_n)\)（不能是含参数的函数）
抽样分布：\(Y\) 的概率分布
样本均值：随机样本值的算术平均
样本方差：，样本标准差 \(S\)

Theorem 5.2.4

\(min_a\Sigma_{i=1}^n|x_i-a|=\Sigma_{i=1}^n|x_i-median(x_1,...,x_n)|\)

Lemma 5.2.5

Theorem 5.2.6（\(\overline X\) 和 \(S^2\) 的无偏性）

统计量 \(\overline X\) 和 \(S^2\) 分别称为 \(\mu\) 和 \(\sigma^2\) 的无偏估计量

Example 5.2.10（Cauchy 随机变量的和）

\(Cauchy(0,\sigma)+Cauchy(0,\tau)\sim Cauchy(0,\sigma+\tau)\)

5.3 正态分布的抽样

Theorem 5.3.1（正态分布下 \(\overline X\) 和 \(S^2\) 的分布）

Lemma 5.3.2（关于 \(\chi^2\) 随机变量的若干事实）

正态随机变量的线性组合

Lemma 5.3.3

对于由独立的正态随机变量的线性函数构成的随机变量，协方差等于 0 等价于独立。

导出分布：\(t\) 分布与 \(F\) 分布

略。

5.4 次序统计量

Def

次序统计量：\(X_{(1)},...,X_{(n)}\)
样本极差 \(R=X_{(n)}-X_{(1)}\)
样本中程数 midrange \(M=\frac{1}{2}(X_{(1)}+X_{(n)})\)

Theorem 5.4.4（次序统计量的 pdf）

Example 5.4.5

Theorem 5.4.6（次序统计量的联合 pdf）

5.5 收敛的概念

依概率收敛

Def

依概率收敛：

Theorem 5.5.2（弱大数定律：样本均值依概率收敛于总体均值）

Example 5.5.3（\(S^2\) 的相合性：\(lim_{n\rightarrow +\infty}VarS_n^2=0 \Rightarrow S_n^2\) 依概率收敛于 \(\sigma^2\)）

Thm 5.5.4（依概率收敛 \(\Rightarrow\) 连续函数依概率收敛）

几乎处处收敛

Def

几乎处处收敛：（几乎处处收敛 \(\Rightarrow\) 依概率收敛）

Theorem 5.5.9（强大数定律：样本均值几乎处处收敛于整体均值）

依分布收敛

Def

依分布收敛：

Theorem 5.5.12（依概率收敛于随机变量 \(\Rightarrow\) 依分布收敛）

Theorem 5.5.13（依概率收敛于常数 \(\Leftrightarrow\) 依分布收敛）

Theorem 5.5.15（中心极限定理：总体分布方差有限 \(\Rightarrow \sqrt n (\overline{X_n}-\mu)/\sigma\) 依概率收敛于 \(N(0,1)\)）

可以用于近似计算概率

Theorem 5.5.17（Slutsky 定理）

c. \(\frac{X_n}{Y_n}\rightarrow \frac{X}{C}\)

\(\triangle\) 方法

Theorem 5.5.24（\(\triangle\) 方法）

Theorem 5.5.26（二阶 \(\triangle\) 方法）

5.6 生成随机样本

直接法

间接法

舍选法

Ch6 数据简化原理

6.2 充分性原理

充分统计量

Def

充分统计量：如果样本 \(X\) 在已知统计量 \(T(X)\) 取值时的条件分布 \(P\{X=x|T(X)=T(x)\}\) 与 \(\theta\) 无关，则称 \(T(X)\) 为充分统计量。
- 除指数族分布外，其它分布中少有维数低于样本大小的充分统计量，因此很多时候次序统计量已经是我们能找到的最好的充分统计量。

Theorem 6.2.6（因子分解定理）

Theorem 6.2.10（指数族总体的充分统计量）

极小充分统计量

Def

极小充分统计量：称充分统计量 \(T(X)\) 是极小充分统计量，如果对其余任一充分统计量 \(T'(X)\)，\(T(X)\) 都是 \(T'(X)\) 的函数。

Theorem 6.2.13（Lehman and Scheffe）

辅助统计量

Def

辅助统计量：如果统计量 \(S(X)\) 的分布与 \(\theta\) 无关，则称它为辅助统计量。

Example 6.2.18-19（位置族、尺度族辅助统计量）

完全统计量

Def

完全的概率分布族：设 \(f(x|\theta),\theta \in \Theta\)，\(\{ P_\theta|\theta \in \Theta\}\) 是概率分布族，称 \(\{ P_\theta|\theta \in \Theta\}\) 是完全的，如果对 \(X\sim P_\theta\)，若 \(E_\theta g(X)=\int g(x) dP_\theta(x)=0,\forall\theta\in\Theta\)，则有 \(g(x)=0,a.e.\)
完全统计量：

Theorem 6.2.24（Basu 定理：极小充分统计量和任意辅助统计量独立的条件）

Theorem 6.2.25（指数族总体的完全统计量）

Ch7 点估计

7.2 求估计量的方法

Def

点估计量：样本的任何一个函数 \(W(X_1,...,X_n)\)

Theorem（统计学基本定理）

\(X_1,...,X_n\stackrel{i.i.d.}{\sim} F(x)\)，经验分布函数 \(F_n(x)=\frac{1}{n}\Sigma^n_{i=1}I(x_i≤x)\)，则有 \(F_n(x)\stackrel{a.s.}{\rightarrow} F(x),\ \forall x\)

Def（矩估计）

由统计学基本定理，若 \(|Eg(X)|<\infty\)，可以取 \(\frac{1}{n}\Sigma_{i=1}^n g(x_i) \rightarrow Eg(x)=G(\theta)\) 作为 \(\theta\) 的估计。当取 \(g(x)=x^k\) 时，\(G_k(\theta)=E_\theta x^k:=\frac{1}{n}\Sigma_{i=1}^n x_i^k\) 称为 \(\theta\) 的矩估计。

最大似然估计

Def

似然函数：若 \(X_1,...,X_n\stackrel{i.i.d.}{\sim} f(x|\theta),\ \theta \in \Theta\)，则 \(L(\theta|x_1,...,x_n)=\Pi^n_{i=1}f(x_i|\theta)\) 称为似然函数。
最大似然估计 MLE：
- 计算方法：算 \(L(\theta)\)，求一阶导的零点，再求二阶导证明最大。

Theorem 7.2.10（最大似然估计的不变原理）

Bayes 估计

Def

先验分布：在见到抽样数据之前，通过预先对 \(\theta\) 了解的信息，假设 \(\theta\sim \pi(\theta)\)
后验分布：给定样本 \(x\) 的条件下 \(\theta\) 的条件分布，即 \(\pi(\theta|x)=\frac{f(x|\theta)\pi(\theta)}{m(x)}\)，其中 \(m(x)\) 为 \(x\) 的边缘分布，\(m(x)=\int f(x|\theta)\pi(\theta)d\theta\)
- 可以利用后验分布 \(\pi(\theta|x)\) 对 \(\theta\) 进行推断，比如取后验均值 \(\underset{\pi(\theta|x)}{E}\ \theta\)，最大值 \(\underset{\theta}{max}\ \pi(\theta|x)\) 作为 \(\theta\) 的估计。

Example 7.2.14（二项分布的 Bayes 估计）

设 \(X_1,...,X_n\stackrel{i.i.d.}{\sim} Bernoulli(p)\)，则 \(Y=\Sigma_{i=1}^n X_i\sim binomial(n,p)\)。假设 \(p\) 的先验分布是 Beta 分布，\(p\sim beta(\alpha,\beta)\)，则后验分布 \(f(p|y)\sim beta(y+\alpha,n-y+\beta)\)，用后验分布的均值估计 \(p\)，得 \(\widehat p_B=\frac{y+\alpha}{\alpha+\beta+n}=(\frac{n}{\alpha+\beta+n})(\frac{y}{n})+(\frac{\alpha+\beta}{\alpha+\beta+n})(\frac{\alpha}{\alpha+\beta})\)，为样本均值 \(\frac{y}{n}\) 和先验均值 \(\frac{\alpha}{\alpha+\beta}\) 的一个线性组合。

Example 7.2.16（正态分布的 Bayes 估计）

7.3 估计量的评价方法

Def

相合性：当 \(n\rightarrow +\infty\) 时，若 \(\widehat\theta_n \stackrel{P}{\rightarrow} \theta,\ \theta\in\Theta\)，则称 \(\widehat\theta_n\) 是 \(\theta\) 的（弱）相合估计。

均方误差

Def

均方误差 MSE：参数 \(\theta\) 的估计量 \(\widehat\theta_n\) 的均方误差定义为 \(E|\widehat\theta_n-\theta|^2=Var(\widehat\theta_n)+(E\widehat\theta_n-\theta)^2\)
偏倚 bias：\(Bias(\widehat\theta_n)=E\widehat\theta_n-\theta\)
无偏估计量：满足 \(Bias(\widehat\theta_n)=0\)，即 \(E|\widehat\theta_n-\theta|^2=Var(\widehat\theta_n)\)

UMVUE

Def

一致最小方差无偏估计量 UMVUE：

Theorem 7.3.9（Cramer-Rao不等式：估计量方差下界）

取 \(W(X)\) 为 \(\tau(\theta)\) 的无偏估计，则 \(E_\theta W(X)=\tau(\theta)\)。上式等号成立当且仅当存在 \(c(\theta),d(\theta)\)，使得 \(W(X)-\tau(\theta)=d(\theta)(\frac{\partial}{\partial \theta}\log f(x|\theta))\)
- 一般来说，若概率密度函数 \(f(x|\theta)\) 不等于零的范围（支撑集）依赖于参数，该定理将不再适用。
- Fisher 信息量 \(I(\theta)=E_\theta ((\frac{\partial}{\partial \theta}\log f(x|\theta))^2)\)

UMVUE 与充分统计量

Lemma

Theorem 7.3.17（Rao-Blackwell：利用充分统计量获得更好的无偏估计）

Theorem 7.3.19（UMVUE 的唯一性）

- 证明思路：Cauchy-Schwarz 不等式

Theorem 7.3.20

即：若 \(W\) 是 UMVUE，那么 \(Cov_\theta(W,U)=0,\ \forall\theta,\ \forall U\) 满足 \(E_\theta U=0\)

Theorem 7.3.23

设 \(X_1,...,X_n\stackrel{i.i.d.}{\sim} f(x|\theta),\ \theta\in\Theta\)，\(W(x)\) 为 \(\tau(\theta)\) 的一个无偏估计，\(T(x)\) 是一个充分完全统计量，则 \(E(W|T)\) 是 \(\tau(\theta)\) 的 UMVUE。

Ch8 假设检验

Def

假设：关于总体参数的一个陈述。
原假设 \(H_0\)，备择假设 \(H_1\)：一个假设检验问题中两个互补的假设，一般格式是 \(H_0:\theta\in\Theta_0\) 和 \(H_1:\theta\in\Theta_0^C\)
假设检验：收集样本 \(X=(X_1,...,X_n)\)，制定规则来判断 \(H_0\) 和 \(H_1\) 的真伪。当 \(x\in R\) 时，拒绝 \(H_0\)；否则，接受 \(H_0\).
拒绝域：\(R\)

8.2 检验的求法

似然比检验

Def

似然比检验 LRT：

Theorem 8.2.4

Bayes 检验

Def

Bayes 检验：结合抽样分布 \(f(x|\theta)\) 和先验分布 \(\pi(\theta)\)，我们可以得到后验分布 \(\pi(\theta|x)\)，所有关于 \(\theta\) 的推断都基于后验分布进行。拒绝域 \(R:=\{X\ |\ \mathbb P(\theta\in\Theta_0|X)<\mathbb P(\theta\in\Theta_0^C|X)\}=\{X\ |\ \mathbb P(\theta\in\Theta_0|X)<\frac{1}{2}\}\)

并-交检验和交-并检验

Def

并-交检验：
交-并检验：

8.3 检验的评价方法

错误概率与功效函数

Def

第一类错误：\(H_0\) 成立，但是 \(x\in R\)（拒绝 \(H_0\)）
第二类错误：\(H_0^C\) 成立，但是 \(x\in R^C\)（拒绝 \(H_0^C\)）

功效函数：\(\beta(\theta)=\mathbb P_\theta(x\in R)\)
真实水平/水平：

无偏检验

Def

无偏检验：
一致最大功效（UMP）检验：

Theorem 8.3.12（Neyman-Pearson 引理）

Ch9 区间估计

Def

区间估计：
- 区间可以为闭、开、半开半闭，\(L(x)\) 和 \(U(x)\) 可以取 \(\pm\infty\)
覆盖率 CP：\(\mathbb P_\theta(\theta\in[L(X),U(X)])\)
- 陈述是针对 \(X\) 而非 \(\theta\) 的
置信系数：\(\inf_\theta \mathbb P_\theta(\theta\in[L(X),U(X)])\)
置信区间：区间估计量 + 置信系数

9.2 区间估计量的求法

评价标准：限定 \(\inf_\theta \mathbb P_\theta(\theta\in[L(X),U(X)])=1-\alpha,\ \alpha>0\)，使得 \(E(U(X)-L(X))\) 达到最小值。

枢轴量法

Def

枢轴量：\(Q(X_1,...,X_n,\theta)=Q(T(X),\theta)\) 与 \(X_1,...,X_n,\theta\) 有关，但它的分布与 \(\theta\) 无关，这样的 \(Q\) 被称为枢轴量。

Example 9.2.7（位置-尺度枢轴）

posted @ 2023-11-12 23:43 SELFLOVER 阅读(437) 评论(0) 编辑收藏举报

刷新页面返回顶部

SELFLOVER

谁来教我数学！

统计推断 复习笔记

Ch1 概率论

Ch2 变换和期望

Ch3 常见分布族

Ch4 多维随机变量

Thm 4.6.11（多个随机向量独立）

Thm 4.6.12（多个随机向量独立 \(\Rightarrow\) 一元函数独立）

Ch5 随机样本的性质

5.1 随机样本的基本概念

Def

5.2 随机样本中随机变量的和

Def

Theorem 5.2.4

Lemma 5.2.5

Theorem 5.2.6（\(\overline X\) 和 \(S^2\) 的无偏性）

Example 5.2.10（Cauchy 随机变量的和）

5.3 正态分布的抽样

Theorem 5.3.1（正态分布下 \(\overline X\) 和 \(S^2\) 的分布）

Lemma 5.3.2（关于 \(\chi^2\) 随机变量的若干事实）

正态随机变量的线性组合

Lemma 5.3.3

导出分布：\(t\) 分布与 \(F\) 分布

5.4 次序统计量

Def

Theorem 5.4.4（次序统计量的 pdf）

Example 5.4.5

Theorem 5.4.6（次序统计量的联合 pdf）

5.5 收敛的概念

依概率收敛

Def

Theorem 5.5.2（弱大数定律：样本均值依概率收敛于总体均值）

Example 5.5.3（\(S^2\) 的相合性：\(lim_{n\rightarrow +\infty}VarS_n^2=0 \Rightarrow S_n^2\) 依概率收敛于 \(\sigma^2\)）

Thm 5.5.4（依概率收敛 \(\Rightarrow\) 连续函数依概率收敛）

几乎处处收敛

Def

Theorem 5.5.9（强大数定律：样本均值几乎处处收敛于整体均值）

依分布收敛

Def

Theorem 5.5.12（依概率收敛于随机变量 \(\Rightarrow\) 依分布收敛）

Theorem 5.5.13（依概率收敛于常数 \(\Leftrightarrow\) 依分布收敛）

Theorem 5.5.15（中心极限定理：总体分布方差有限 \(\Rightarrow \sqrt n (\overline{X_n}-\mu)/\sigma\) 依概率收敛于 \(N(0,1)\)）

Theorem 5.5.17（Slutsky 定理）

\(\triangle\) 方法

Theorem 5.5.24（\(\triangle\) 方法）

Theorem 5.5.26（二阶 \(\triangle\) 方法）

5.6 生成随机样本

直接法

间接法

舍选法

Ch6 数据简化原理

6.2 充分性原理

充分统计量

Def

Theorem 6.2.6（因子分解定理）

Theorem 6.2.10（指数族总体的充分统计量）

极小充分统计量

Def

Theorem 6.2.13（Lehman and Scheffe）

辅助统计量

Def

Example 6.2.18-19（位置族、尺度族辅助统计量）

完全统计量

Def

Theorem 6.2.24（Basu 定理：极小充分统计量和任意辅助统计量独立的条件）

Theorem 6.2.25（指数族总体的完全统计量）

Ch7 点估计

7.2 求估计量的方法

Def

Theorem（统计学基本定理）

Def（矩估计）

最大似然估计

Def

Theorem 7.2.10（最大似然估计的不变原理）

Bayes 估计

Def

Example 7.2.14（二项分布的 Bayes 估计）

Example 7.2.16（正态分布的 Bayes 估计）

7.3 估计量的评价方法

统计推断复习笔记