BUAA_概率统计_Chap08_参数估计
第八章 参数估计
8.1 参数的点估计
8.1.1 矩估计法
用样本矩估计相应的总体(随机变量)矩。
只要总体的 \(k\) 阶矩存在,样本 \(k\) 阶矩依概率收敛于相应的总体 \(k\) 阶矩。
具体过程
设总体 \(X\) 的分布函数为 \(F(x;\theta_1,\theta_2,...,\theta_m)\),未知参数为 \(\theta_1,\theta_2,...,\theta_m\).
-
求出总体矩:\(\mu_k=EX^k=\mu_k(\theta_1,\theta_2,...,\theta_m), k=1,2,...,m\) 或 \(\beta_k=E(X-EX)^k=\beta_k(\theta_1,\theta_2,...,\theta_m),k=1,2,...m\);
-
对总体进行随机抽样,设 \(X_1,X_2,...,X_n\) 为来自于总体 \(X\) 的样本,\(x_1,x_2,...,x_n\) 为样本值;
-
构造样本矩:\(A_k=\dfrac{1}{n}\sum\limits_{i=1}^nX_i^k,\space B_k=\dfrac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{x})^k,\space S^2=\dfrac{1}{n-1}\sum\limits_{i=1}^n(X_i-\overline{x})^2\);
-
由于:\(A_k=\dfrac{1}{n}\sum\limits_{i=1}^nX_i^k\stackrel{P}\longrightarrow EX^k=\mu_k(n\to +\infty),\space B_k=\dfrac{1}{n}\sum\limits_{i=1}^n(X_i-\overline{x})^k\stackrel{P}\longrightarrow E(X-EX)^k=\beta_k(n\to +\infty)\);
-
联立并解方程组求出 \(\theta_1,\theta_2,...,\theta_m\).
8.1.2 极大似然估计法
基本思想
根据样本的具体情况,选择总体参数的估计,使得该样本发生的概率最大。
定义1
若 \(X\) 是离散型随机变量,分布律 \(P\{X=x\}=p(x;\theta)\) 形式已知,参数 \(\theta\) 未知,\(x_1,x_2,...,x_n\) 为样本 \(X_1,X_2,...,X_n\) 的样本观察值。
\(X_1,X_2,...,X_n\) 取到 \(x_1,x_2,...,x_n\) 的概率:
选取总体参数 \(\theta\) 的估计值 \(\hat{\theta}\),使得此概率达到最大,即 \(\prod\limits_{i=1}^np\{x_i;\theta\}\) 达到最大值。
\(L(\theta)=L(x_1,x_2,...,x_n;\theta)=\prod\limits_{i=1}^n p\{x_i;\theta\}\) 称为极大似然函数。
定义2
若 \(X\) 是连续型随机变量,概率密度函为 \(f(x;\theta)\),其中 \(\theta\) 为未知参数,\((X_1,X_2,...,X_n)\) 落在点 \((x_1,x_2,...x_n)\) 邻域内的概率为 \(\prod\limits_{i=1}^nf(x_i;\theta)\prod\limits_{i=1}^n\Delta x_i\)
选取总体参数 \(\theta\) 的估计值 \(\hat{\theta}\),使得此概率达到最大,即 \(\prod\limits_{i=1}^nf\{x_i;\theta\}\) 达到最大值。
\(L(\theta)=L(x_1,x_2,..x_n;\theta)=\prod\limits_{i=1}^n f\{x_i;\theta\}\) 称为极大似然函数。
定义3
如果似然函数 \(L(\theta)=L(x_1,x_2,...,x_n)\) 在 \(\theta=\hat{\theta}\) 时达到最大值,则称 \(\hat{\theta}\) 是函数 \(\theta\) 的极大似然估计值
要使 \(L(\theta)\) 达到最大值,\(\hat{\theta}\) 必须满足 \(\dfrac{d}{d\theta}L(\theta)=0\)
通常由 \(\dfrac{d}{d\theta}\ln L(\theta)=0\) 求得
8.2 点估计的优良性
8.2.1 无偏性
定义
设 \(\hat{\theta}(X_1,X_2,...,X_n)\) (简记为 \(\hat{\theta}\))为未知参数 \(\theta\) 的估计量,若 \(E(\hat{\theta})=\theta\)(真值),则称 \(\hat{\theta}\) 为 \(\theta\) 的无偏估计。
8.2.2 最小方差无偏估计(有效性)
定义
设 \(\hat{\theta}\) 是 \(\theta\) 的一个无偏估计,若对于 \(\theta\) 的任一无偏估计 \(\hat{\theta}'\),成立:
则称 \(\hat{\theta}\) 是 \(\theta\) 的最小方差无偏估计。
若 \(\hat{\theta}_1\) 和 \(\hat{\theta}_2\) 都是无偏估计量,且 \(D(\hat{\theta}_1)<D(\hat{\theta}_2)\),则称估计量 \(\hat{\theta}_1\) 较 \(\hat{\theta}_2\) 有效,或较佳,或较优。
8.2.3 一致估计(相合性)
定义
设 \(\hat{\theta}(X_1,X_2,...,X_n)\) 为未知参数 \(\theta\) 的估计量,若 \(\hat{\theta}\) 依概率收敛于 \(0\),即对任意的 \(\epsilon>0,\lim\limits_{n\to +\infty}P\{|\hat{\theta}-\theta|<\epsilon\}=1\),则称 \(\hat{\theta}\) 为 \(\theta\) 的一致性估计。
8.3 区间估计
8.3.1 置信区间
设总体分布含有一未知参数 \(\theta\),又 \(X_1,X_2,...,X_n\) 为来自于总体的样本,若对给定的 \(\alpha\space(0<\alpha<1)\),统计量 \(\theta_1(X_1,X_2,...,X_n)\) 和 \(\theta_2(X_1,X_2,...,X_n)\) 满足:
则称区间 \([\theta_1,\theta_2]\) 为 \(\theta\) 相应于置信度是 \(1-\alpha\) 的置信区间,简称置信区间。
\(\theta_1,\theta_2\) 分别称为置信下限和置信上限。
注
- 统计量 \(\theta_1(X_1,X_2,...,X_n)\) 和 \(\theta_2(X_1,X_2,...X_n)\) 是随机变量,区间 \([\theta_1,\theta_2]\) 是置信区间。
对于 \(x_1,x_2,...,x_n\),区间 \([\theta_1,\theta_2]\) 是普通区间。
-
\(\alpha\) 较小时,随机区间以较大的概率包含 \(\theta\)
-
置信区间的长度意味着误差,因此越小越好
8.3.2 单侧置信限
若对于给定的 \(\alpha(0 < \alpha < 1)\),统计量 \(\theta_1(X_1,X_2,...,X_n)\) 满足 \(P\{\theta\geq\theta_1(X_1,X_2,...,X_n)\}=1-\alpha\),则称区间 \([\theta_1,+\infty)\) 为 \(\theta\) 相应于置信度是 \(1-\alpha\) 的单侧置信区间,称 \(\theta_1\) 为置信度为 \(1-\alpha\) 的单侧置信下限。
若对于给定的 \(\alpha(0<\alpha<1)\),统计量 \(\theta_2(X_1,X_2,...,X_n)\) 满足 \(P\{\theta\leq\theta_2(X_1,X_2,...,X_n)\}=1-\alpha\),则称区间 \((-\infty,\theta_2]\) 为 \(\theta\) 相应于置信度为 \(1-\alpha\) 的单侧置信区间,称 \(\theta_2\) 为置信度为 \(1-\alpha\) 的单侧置信上限。
8.4 正态分布均值和方差的区间估计
8.4.1 均值 \(EX=\mu\) 的区间估计
1.方差 \(DX=\sigma_0^2\) 已知,对 \(EX=\mu\) 进行区间估计
设总体 \(X\sim N(\mu,\sigma_0^2)\),其中 \(\sigma_0^2\) 已知,又 \(X_1,X_2,...,X_n\) 为来自于总体的样本。
求出统计量 \(\mu_1(X_1,X_2,...,X_n),\mu_2(X_1,X_2,...,X_n)\) 使:
标准正态分布 \(N(0,1)\) 的 \(\alpha\) 分位点
定义
设 \(X\) 是一个标准正态随机变量,给定 \(\alpha(0<\alpha<1)\),若存在唯一的 \(z_{\alpha}\),使得:
称 \(z_{\alpha}\) 为标准正态分布的 \(\alpha\) 分位点(或 \(\alpha\) 分位数),简称分位点。
分位点的性质:
\(\forall \alpha(0<\alpha<1)\) 有:
- \(z_{1-\alpha}=-z_\alpha \quad P\{X>z_{\alpha}\}=1-\alpha\) 或 \(P\{X>-z_{1-\alpha}\}=1-\alpha\)
- \(P\{X>z_{1-\alpha}\}=\alpha\) 或 \(P\{X<z_{1-\alpha}\}=1-\alpha\)
- \(P\{|X|>z_{1-\frac{\alpha}{2}}\}\) 或 \(P\{|X|\leq z_{1-\frac{\alpha}{2}}\}=1-\alpha\)
对于给定的 \(\alpha\),标准正态分布的双侧分位点 \(z_{1-\frac{\alpha}{2}}\),使:
即:
区间 \([\overline{X} - z_{1-\frac{\alpha}{2}}\dfrac{\sigma_0}{\sqrt{n}},\overline{X} + z_{1-\frac{\alpha}{2}}\dfrac{\sigma_0}{\sqrt{n}}]\) 为 \(\mu\) 的置信度为 \(1-\alpha\) 的置信区间
2.方差 \(DX\) 未知,对 \(EX=\mu\) 进行区间估计
设 \(X_1,X_2,...,X_n\) 为正态总体 \(N(\mu,\sigma^2)\) 的一个样本,由于 \(\sigma ^ 2\) 未知,用样本方差 \(S^2\) 来代替总体方差 \(\sigma^2\)
对给定的 \(\alpha\),可得 \(t\) 分布的双侧 \(\alpha\) 分位点 \(t_{1-\frac{\alpha}{2}}(n - 1)\),使得:
故均值 \(\mu\) 的置信区间:
8.4.2 方差 \(DX\) 的区间估计(总体均值未知)
设总体 \(X \sim N(\mu,\sigma^2),X_1,X_2,...,X_n\) 是总体的样本,令:
对给定的 \(\alpha(0<\alpha<1)\),得 \(\chi^2\) 分布的临界值 \(\chi^2_{\frac{\alpha}{2}}(n-1)\) 及 \(\chi_{1-\frac{\alpha}{2}}(n-1)\)
当总体 \(N(\mu,\sigma^2)\) 的参数 \(\mu\) 未知,方差 \(\sigma^2\) 的置信区间为:
注1:
选取的临界值 \(\chi^2_{\frac{\alpha}{2}}(n-1),\chi^2_{1-\frac{\alpha}{2}}(n-1)\) 不是唯一的。
注2:
\(\sigma\) 的置信区间是 \(\Big[\sqrt{\dfrac{(n-1)S^2}{\chi^2_{1-\frac{\alpha}{2}}(n-1)}} ,\sqrt{\dfrac{(n-1)S^2}{\chi^2_{\frac{\alpha}{2}}(n-1)}}\Big]\)