06_大样本OLS

第6章大样本OLS

6.1 为何需要大样本理论

定义大样本理论（渐近理论）
研究当样本容量n趋向无穷大时统计量的性质。

大样本理论成为主流的原因：

小样本理论的假设过强。
1. 严格外生性假设要求解释变量与所有的扰动项正交（不相关）。时间序列的自相关太常见了
2. 假定扰动项为正态分布，大样本理论无此限制。绝大部分经济变量不符合正态分布
小样本下，必须研究统计量的精确分布，大样本只需要渐近分布，这个更易推导。
大样本的代价是要求样本容量够大，至少30个，最好是100以上，这点在现代很容易实现。

6.2 随机收敛

1.确定性序列的收敛

确定性序列$\{a_n\}_{n=1}^{\infty}=\{a_1,a_2,a_3,\cdots \}$收敛于常数 $a$，记为$$\lim_{n\to \infty}a_n = a \quad or \quad a_n \to a$$如果对于任意小的正数$\epsilon > 0$，都存在$N > 0$，只要$n>N$，就有$|a_n-a| < \epsilon$ 。

只要n足够大，序列总会落到以a为中心的极小区间里面。

2.随机序列的收敛

定义 依概率收敛 (Convergence in Probability)
随机序列 $\lbrace x_n \rbrace_{n=1}^{\infty}$ 依概率收敛于常数 a，记为 $p\lim_{n\to \infty}x_n=a$，如果对于任意 $ϵ>0$，当 $n \to \infty$ 时，都有 $$\lim_{n\to\infty} P(∣xn−a∣>ϵ)=0 \quad or\quad x_n \xrightarrow{p} a$$
任意给定很小的正数$\epsilon>0$，当n越来越大时，随机变量落入$(a-\epsilon,a+\epsilon)$之外的概率趋近于0。

定理 连续映射定理$$p\lim_{n\to\infty}g(x) =g(p\lim_{n\to\infty}x_n)$$

3.依均方的收敛

定义 依均方收敛 (Convergence in Mean Square)
如果随机序列 $\lbrace x_n \rbrace_{n=1}^{\infty}$ 的期望收敛于 a，方差收敛于0，即 $\lim_{n→∞}E(x_n)=a$，且$\lim_{n\to\infty}Var(x_n)$ 收敛于0，则称 ${x_n}$ 依均方收敛于常数 a，记为$x_n \xrightarrow{ms} a$。

依均方收敛意味着依概率收敛，依均方收敛通常比证明依概率收敛要容易，所以常被用来证明依概率收敛。

4.依分布的收敛

定义 依分布收敛 (Convergence in Distribution)
如果随机序列${x_n}$ 的累积分布函数$F_n(x)$对于任意给定的x 都收敛于某个随机变量 X 的累积分布函数$F(x)$，即$$\lim_{n→∞}F_n(x)=F(x)$$则称$\lbrace x_n \rbrace$ 依分布收敛于随机变量 x，记为$x_n \xrightarrow{d} x$。
那么，$x$的分布就是$x_n$的渐近分布。

依分布收敛关注的是随机变量序列的分布函数的收敛性，而不关心随机变量序列本身的具体取值。

6.3 大数定律与中心极限定理

1.切比雪夫不等式

定义切比雪夫不等式
设服从任意分布的随机变量X的随机变量X的数学期望$E(X)=\mu$，方差$D(X)=\mu^2$，则：$$P(|X-\mu|\le k\sigma) \ge 1 - \frac{1}{k^2},k \gt1$$
利用切比雪夫不等式，可以在随机变量X的分布未知的情况下，对事件$|X-\mu|\lt k\sigma$的概率作出估计。

例：对于任意一个分布而言，观测值落在偏离均值正负3个标准差内的概率最下位多少？

解析：根据切比雪夫不等式：$$P(|X-\mu| \le 3\sigma)\ge 1-\frac{1}{3^2} \approx 89% $$

2.大数定律

定义大数定律
设随机变量$X_1,X_2,…,X_n$独立同分布（i.i.d）

期望为$\mu$
$S_n=X_1+X_2+\cdots+X_n = \sum_{i=1}^nx_i$
则$\frac{S_n}{n}$收敛于$\mu$ : $$\lim \limits_{n \to \infty}\overline X = \mu$$

样本容量n足够大，样本均值就趋于总体均值

3.中心极限定理

定义中心极限定理
设随机变量$X_1,X_2,…,X_n$独立同分布，且具有有限的数学期望和方差：$E (X_k) = μ$，$D(X_k) =σ^2 > 0$，当n充分大时，样本均值近似服从正态分布，即：$$\overline X \sim N(\mu,\frac{\sigma^2}{n})$$

6.4 使用蒙特卡罗模拟中心极限定理

[[Chapter_06.ipynb]]

6.5 统计量的大样本性质

1.一致估计量

定义 一致估计量（consistent estimator）
估计量$\hat\beta_n$ 是参数 $\beta$ 的一致估计量，有：$$p\lim_{n\to\infty} \hat\beta_n = \beta$$

2.渐近正态分布与渐近方差

定义 asymptotically normal
如果$\sqrt{n}(\hat\beta_n-\beta) \xrightarrow{d} N(0, \sigma^2)$，则

$\hat\beta_n$ 是渐近正态分布
$\sigma^2$ 为其渐近方差，记为$Avar(\hat\beta_n)$

3.渐近有效

定义 asymptotically more efficient
假设 $\hat\beta$ 和 $\tilde \beta$ 都是渐近正态分布：

如果 $Avar(\hat\beta) \le Avar(\tilde\beta)$，则称设 $\hat\beta$ 比 $\tilde \beta$ 更渐近有效。

6.6 随机过程的性质

随机序列有个更好听的名字，随机过程(stochastic process)

如果下标是时间，则称为时间序列(time series)

1.严格平稳过程

定义 严格平稳过程(strictly stationary process)
如果对任意m个时期的时间集合$\{t_1,t_2,\cdots , t_m\}$，随机向量$\{x_{t_1},x_{t_2},\cdots,x_{t_m}\}$的联合分布等于随机向量$\{x_{t_{1+k}},x_{t_{2+k}},\cdots,x_{t_{m+k}}\}$的联合分布。

k为任意整数
平稳过程的联合分布
不随时间下标变化 —— t
只与时间长度相关 —— m

定义 弱平稳过程(strictly stationary process)
随机过程$x_t$是弱平稳过程（weakly stationary process），或协方差平稳过程（covariance stationary process）：

$E(x_t)$ 不依赖于t，是个常数
$Cov(x_t,x_{t+k})$只依赖于k，不依赖其绝对位置t
- 当 k=0 时，$Cov(x_t, x_{t+0}) = Var(x)$

严格平稳过程必然是弱平稳过程，但弱平稳过程不一定是严格平稳过程。

定义 白噪声过程(white noise process)
期望、协方差均为0（不同期之间的噪声互不相关）的弱平稳过程就是白噪声过程。

$E(x_t)=0$
$Cov(x_t, x_{t+k})=0$ （$\forall k \ne 0$）

2.渐近独立

严格平稳过程还不足以应用大数定律和中心极限定理

只有同分布，不是独立同分布（iid）
有没有什么办法进行近似的估计？
相互独立：在大多数经济变量而言过于严格
渐近独立：只要两个随机变量相距足够远，可近似任务他们相互独立。

定理渐近独立定理（Ergodic Theorem）
假设 $\lbrace x_i \rbrace_{i=1}^\infty$ 为渐近独立的严格平稳过程，其期望为 $E(x_i)=\mu$ 存在，则$$\overline {x} \equiv \frac{1}{n}\sum_{i=1}^\infty x_i \rightarrow{P}\mu$$即，样本均值 $\overline x_i$ 是总体均值 $E(x_i)$ 的一致估计。

将该定理向中心极限定理推广。
命题如果$\lbrace x_i \rbrace_{i=1}^\infty$ 为渐近独立的严格平稳过程，则对于任何连续函数$f(·)$，$\lbrace y \equiv f(x_i) \rbrace_{i=1}^\infty$也是渐近独立的严格平稳过程。

6.7 大样本OLS的假定

假定 6.1 线性假定

假定 6.2 $(K+1)$ 维随机过程$\{ y_i,x_{i1},x_{i2},\cdots,x_{iK} \}$为渐近独立的平稳过程，故适用于大数定律和中心极限定理

假定 6.3 前定解释变量（perdetemined regressors）
所有解释变量都是前定的，也称同期外生，即与同期的扰动项正交，即不相关。

假定 6.4 秩条件
数据矩阵X满列秩，即X中没有多余的解释变量。

6.8 OLS的大样本性质

在上述假定之下，OLS估计量具有以下良好的大样本性质。

$\hat\beta$为一致估计量，即$p\lim_{n \to \infty} \hat\beta = \beta$
$\hat\beta$ 服从渐近正态分布，即$\sqrt n(\hat\beta-\beta) \rightarrow{p}N(0,Avar(\hat\beta))$
- $Avar(\hat\beta)$ 为 $\hat\beta$ 的渐近协方差矩阵
由于大样本理论一般不假设[[05_多元线性回归#^2b980b| 球形扰动项]]，故渐近协方差矩阵 $Avar(\hat\beta)$ 的表达式更为复杂。

定义一些计量经济学的术语

如果解释变量与扰动项相关，则称此解释变了为内生解释变量，否则为外生解释变量。
由于内生变量的存在，使得OLS回归结果出现偏差，统称为内生性偏差，简称内生性。

定义稳健标准误（robust standard errors）/ 异方差稳健的标准误（heteroskedasticity-consistent standard errors）

\[\widehat{Avar(\hat\beta|X)}=n(X'X)^{-1}\widehat{Var(\epsilon|X)}X(X'X)^{-1} \]

教材中使用的是White(1980)的公式，在statsmodel中，标记为HC0，
而以White(1985)中使用的公式，在statsmodel中，记为HC1、HC2、HC3

![[sm_docs#OLSResults.HC0_se | sm官方文档]]

6.9 大样本统计推断

对于渐近独立的平稳过程，如果样本容量足够大，则OLS估计量的剪辑正态分布是对其真实分布的较好近似，那就可以使用其渐近分布进行大样本假设检验和区间估计。

大样本统计推断的步骤：

1.检验单个系数： $H_0: \beta_k = c$

因为在推导过程中未使用“条件同方差”的假定，故在“条件异方差”的情况下也适用。
统计量t_k称为稳健t比值（robust t ratio），服从渐近标准正态分布，而不是t分布。$$t_k=\frac{\hat\beta_k-c}{\sqrt{\frac{1}{n}\widehat{Avar(\hat\beta_k)}}}\equiv\frac{\hat\beta_k-c}{SE^*(\hat\beta_k)} \xrightarrow{d} N(0,1)$$

2.检验线性假设：$H_0: R\beta = r$

命题假设统计量$F \sim F(m,n)$，则当$n \to \infty$时，$mF\xrightarrow{d}\chi^2(m)$

统计量W在大样本情况下，服从卡方分布。

6.10 大样本OLS的python命令及实例

案例文献

[[6.10-Returns_to_Scale_in_Electricity_Supply.pdf]]

案例python代码

[[Chapter_06.ipynb]]

6.11 大样本理论的蒙特卡罗模拟

习题

6.1

无偏估计（Unbiased Estimation）和一致估计（Consistent Estimation）是统计学中两种重要的估计性质，它们经常一起讨论，但它们描述的是两个不同的概念。

无偏估计

\[E(\hat \beta)=\beta \]

一致估计

\[p\lim_{n\to\infty}(\hat \beta) = \beta \]

区别

关注点不同：无偏估计关注的是估计量的期望值，而一致估计关注的是估计量随着样本量增加的收敛行为。
概念性质不同：无偏性是一个概率性质，它与估计量的分布有关；一致性是一个收敛性质，它与估计量随着样本量增长的趋势有关。
相关性：一个估计量可以是无偏的但不一致，例如，某些估计量在小样本情况下可能是无偏的，但随着样本量的增加，它们可能无法收敛于真实的总体参数，因此不是一致的。同样，一个估计量可以是一致的但有偏，例如，某些估计量随着样本量的增加会收敛到真实参数值，但其期望值并不等于该参数值。最好的情况是估计量同时具有无偏性和一致性。

结论

无偏估计和一致估计都是估计量的重要性质，但它们描述的是不同的方面。在实际应用中，研究者通常希望找到既无偏又一致的估计量，以确保他们的估计结果既在长期内准确，又能真实反映总体参数的期望值。然而，有时候可能需要在无偏性和一致性之间做出权衡，这取决于具体的统计问题和可用的数据。

posted @ 2024-05-03 22:00 王大桃zzZ 阅读(160) 评论(0) 编辑收藏举报

刷新页面返回顶部

王大桃zzZ

因为懒得烧蛇吃，所以要去学python

06_大样本OLS

第6章大样本OLS

6.1 为何需要大样本理论

6.2 随机收敛

1.确定性序列的收敛

2.随机序列的收敛

3.依均方的收敛

4.依分布的收敛

6.3 大数定律与中心极限定理

1.切比雪夫不等式

2.大数定律

3.中心极限定理

6.4 使用蒙特卡罗模拟中心极限定理

6.5 统计量的大样本性质

1.一致估计量

2.渐近正态分布与渐近方差

3.渐近有效

6.6 随机过程的性质

1.严格平稳过程

2.渐近独立

6.7 大样本OLS的假定

6.8 OLS的大样本性质

6.9 大样本统计推断

1.检验单个系数： \(H_0: \beta_k = c\)

2.检验线性假设：\(H_0: R\beta = r\)

6.10 大样本OLS的python命令及实例

6.11 大样本理论的蒙特卡罗模拟

习题

6.1

无偏估计

一致估计

区别

结论

公告

王大桃zzZ

因为懒得烧蛇吃，所以要去学python

06_大样本OLS

第6章 大样本OLS

6.1 为何需要大样本理论

6.2 随机收敛

1.确定性序列的收敛

2.随机序列的收敛

3.依均方的收敛

4.依分布的收敛

6.3 大数定律与中心极限定理

1.切比雪夫不等式

2.大数定律

3.中心极限定理

6.4 使用蒙特卡罗模拟中心极限定理

6.5 统计量的大样本性质

1.一致估计量

2.渐近正态分布与渐近方差

3.渐近有效

6.6 随机过程的性质

1.严格平稳过程

2.渐近独立

6.7 大样本OLS的假定

6.8 OLS的大样本性质

6.9 大样本统计推断

1.检验单个系数： \(H_0: \beta_k = c\)

2.检验线性假设：\(H_0: R\beta = r\)

6.10 大样本OLS的python命令及实例

6.11 大样本理论的蒙特卡罗模拟

习题

6.1

无偏估计

一致估计

区别

结论

公告

第6章大样本OLS