07 参数估计 | 概率论与数理统计

1. 点估计

1. 点估计

  1. 点估计问题:设总体X的分布函数的类型为已知,但是它的某些参数是未知的,通过总体的一个样本来估计总体未知参数的值的问题称为参数的 点估计 问题
  2. 点估计:设总体X的分布函数F(x,θ),其中θ为待估计的参数,X1,X2,,XnX的一个样本,x1,x2,,xn是相应的样本值;用样本X1,X2,,Xn构造一个适当的统计量θ^(X1,X2,,Xn)用他的观察值θ^(x1,x2,,xn)作为未知参数θ近似值,称θ^(X1,X2,,Xn)θ估计量,称θ^(x1,x2,,xn)θ估计值
  3. 点估计常用方法
    1. 矩估计法
    2. 极大似然估计法

2. 矩估计法

  1. 基本思想:用样本矩估计总体矩,因为由大数定律知,样本的k阶矩依概率收敛与总体的k阶矩,这种用样本(原点)矩作为总体(原点)矩的估计量的方法称为 矩估计法
  2. 方法:设总体X的分布函数为F(x;θ1,θ2,,θk),其中θ1,θ2,,θk为待估计参数,如果μi=E(Xi)(i=1,2,,k)存在,μiθ1,θ2,,θk的函数,记μi=μi(θ1,θ2,,θk)X1,X2,,Xn为总体X的样本,用Ai来估计E(Xi),建立k个方程

    {A1=μ1(θ1,θ2,,θk)A2=μ2(θ1,θ2,,θk)Ak=μk(θ1,θ2,,θk){θ1^=θ1(A1,A2,,Ak)θ2^=θ2(A1,A2,,Ak)θk^=θk(A1,A2,,Ak)

    θi^作为θi的估计量——矩估计量
  3. 常见分布的矩估计量
    1. 均匀分布XU(a,b)
      1. a^=X3ni=1n(XiX)2
      2. b^=X+3ni=1n(XiX)2
    2. 指数分布f(x)=1θexθ
      1. θ^=X
    3. (0-1)分布
      1. p^=X
    4. 二项分布Xb(n,p)

      n^=X2X1ni=1n(XiX)2,p^=11ni=1n(XiX)2X

    5. 正态分布XN(μ,σ2)
      1. μ^=X
      2. σ^2=1ni=1n(XiX)2
    6. 泊松分布Xπ(λ)
      1. λ^=X
      2. λ^=1ni=1n(XiX)2

3. 极大似然估计法

  1. 基本思想:概率最大的事件最可能出现;参数估计的极大似然法是要选取这样的值来作为参数的估计值,使得当参数取这一数值时,观测结果出现的可能性为最大
  2. 似然函数
    1. 离散型:设总体X的分布律P(X=x)=p(x;θ),其中θΘ为待估计的参数,Θθ可能取值的范围,设X1,X2,,Xn是来自X的样本,x1,x2,,xn是样本观察值,则(X1,X2,,Xn)的联合分布率P(X1=x1,X2=x2,,Xn=xn)=i=1np(xi;θ),对固定的样本观察值x1,x2,,xn,它是未知参数的函数,记为L(θ)=L(x1,x2,,xn;θ)=i=1np(xi;θ),θΘ,称之为样本的 似然函数
    2. 连续型:设总体X的概率密度函数为f(x;θ),θΘ为未知参数,此时样本的似然函数为L(θ)=L(x1,x2,,xn;θ)=i=1nf(xi;θ),θΘ
  3. 最大似然估计:如果存在θ^=θ^(x1,x2,,xn),使得L(θ^)=maxθΘL(θ),则称θ^(x1,x2,,xn)θ最大似然估计值θ^(X1,X2,,Xn)最大似然估计量
  4. 如何求L(θ)的最大值
    1. 根据函数的单调性分析
    2. 对数似然方程:由于L(θ)lnL(θ)Θ上有相同的最大值点,因此可以求lnL(θ)关于θ的最大值点,当lnL(θ)关于θ可微时,必然满足方程lnL(θi)θi,(i=1,2,,k),然后确定其为最大值点
  5. 常见分布的最大似然估计量
    1. (0-1)分布
      1. p^=X
    2. 正态分布XN(μ,σ2)
      1. μ^=X
      2. σ^2=1ni=1n(XiX)2
    3. 均匀分布XU(a,b)
      1. a^=min1inXi
      2. b^=max1inXi
    4. 指数分布f(x)=1θexθ
      1. θ^=X
    5. 泊松分布Xπ(λ)
      1. λ^=X

4. 矩估计和极大似然估计的联系和区别

  1. 极大似然法克服了矩估计法的一些缺点, 它利用总体的样本和分布函数表达形式所提供的信息建立未知参数的估计量, 同时它也不要求总体原点矩存在
  2. 极大似然估计量一般要解似然方程,而有时解似然方程很困难,只能用数值方法求似然方程的近似解
  3. 在统计问题中往往先使用最大似然估计法,在最大似然估计法使用不方便时,再用矩估计法

2. 估计量的评选标准

1. 无偏性

  1. 引入原因:估计量是随机变量,对于不同的样本值会得到不同的估计值. 我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值. 这就出现了无偏性这个标准
  2. 无偏估计量:如果估计量θ^=θ(X1,X2,,Xn)的数字期望E(θ^)存在,且对于任意θΘE(θ^)=θ,则称θ^θ无偏估计量

2. 有效性

  1. 引入原因:用θ^估计θ时,仅具有无偏性是不够的,我们希望θ^的取值能集中于θ附近,而且密集的程度越高越好;方差是描述随机变量取值的集中程度的,所以无偏估计以方差小者为好,因此提出所谓 有效性 标准
  2. 有效:设θ1^θ2^都是参数θ的无偏估计,若D(θ1^)D(θ2^),则称θ1^θ2^ 有效

3. 相合性

  1. 引入原因:无偏性和有效性是在样本容量n一定的情况下对估计量提出的要求,一个好的估计量θ^,当样本容量增大时, θ^的取值与参数θ 的真值任意接近的可能性应该更大,因此,还有所谓 一致性 标准
  2. 相合估计量:设θn^是未知参数θ的估计量,如果对于ε>0,有

    limnP(|θ^θ|<ε)=1

    则称θ^θ相合估计量,即θ^Pθ
  3. 定理:若θn^θ 的无偏估计量,且当n时,D(θn^)0θn^θ相合估计量

3. 区间估计

1. 置信区间的概念

  1. 置信区间:设总体X的分布函数F(x;θ),其中θ为未知参数,X1,X2,,Xn是取自总体的样本,对给定值α(0<α<1),如果存在统计量θ1,θ2满足P(θ1<θ<θ2)1α,则称随机区间(θ1,θ2)θ置信水平1α置信区间θ1,θ2分别称为置信度为1α双侧置信下限置信上限
  2. 评价置信区间好坏标准
    1. 精度:θ2θ1越小越好
    2. 置信度:P(θ1<θ<θ2)越大越好
  3. 置信度与估计精度
    1. 估计精度:置信区间的长度θ2θ1
    2. 置信度与估计精度是一对矛盾的量
      1. 置信水平高,则区间大,区间精度差
      2. 置信区间小,则精度高,但置信水平低
      3. 一般准则:在保证置信度的条件下尽可能提高精度

2. 寻求置信区间的方法

  1. 基本思想:在点估计的基础上,构造合适的含样本及待估参数的函数U,且已知 U 的分布,再根据给定的置信度导出待估参数置信区间
  2. 一般步骤
    1. 选取未知参数θ 的某个较优估计量θ^(如无偏估计)
    2. 围绕θ^构造一个与待估参数θ有关的函数U, 且分布已知
    3. 对给定的置信水平1α,确定λ1λ2,使P(λ1<U<λ2)=1α
    4. 对上式作恒等变形,化为P(θ1<θ<θ2)=1α,则(θ1,θ2)就是θ的置信水平为1α的置信区间

4. 正态总均值与方差的区间估计

1. 单个正态总体

  1. 均值μ的置信区间

    1. σ2已知μ的置信度水平为1α的置信区间(Xμσ/nN(0,1)

      (Xσnzα/2,X+σnzα/2)

    2. σ2未知μ的置信度水平为1α的置信区间(XμS/nt(0,1)

      (XSntα/2(n1),X+Sntα/2(n1))

  2. 方差σ2的置信区间(μ未知):(n1)S2σ2χ2(n1)

    ((n1)S2χα/22(n1),(n1)S2χ1α/22(n1))

2. 两个正态总体

  1. 两个总体均值差μ1μ2的置信区间
    1. σ12,σ22已知:μ1μ2的置信区间

      (XYzα/2σ12n1+σ22n2,XY+zα/2σ12n1+σ22n2)

    2. σ12=σ22=σ2,但是σ2未知:μ1μ2的置信区间

      (XY±tα/2(n1+n22)Sw1n1+1n2)

      其中

      Sw2=(n11)S12+(n21)S22n1+n22

  2. 两个总体方差比σ12/σ22
    1. 置信区间:μ1,μ2未知:S12/σ12S22/σ22F(n11,n21)

      (S12S221Fα/2(n11,n21),S12S221F1α/2(n11,n21))

  3. 正态总体均值、方差的置信区间总结

5. (0-1)分布参数的区间估计

1. (0-1)分布参数的区间估计

  1. (0-1)分布参数的区间估计:设总体Xb(1,p)p为未知参数,X的分布律为f(x;p)=px(1p)1x,x=0,1,取X1,X2,,Xn(n>50)作为X的大样本,已知(0-1)分布的均值和方差分别为μ=p,σ2=p(1p),则由中心极限定理

    i=1nXinpnp(1p)=nXnpnp(1p)N(0,1)

    于是有枢轴量

    P(zα/2<nXnpnp(1p)<zα/2)1α

  2. p的近似置信度为1α置信区间为(p1,p2),其中p1=12a(bb24ac),p2=12a(b+b24ac)

    (n+zα/22)p2(2nX+zα/22)p+nX2<0

    得到,记

    a=n+zα/22,b=(2nX+zα/22),c=nX2

6. 单侧置信区间

1. 单侧置信区间

  1. 单侧置信下限:对于给定值α(0<α<1),如果由样本X1,X2,,Xn确定的统计量θ=θ(X1,X2,,Xn),θΘ满足P(θ>θ)=1α,成随机区间(θ,+)θ的置信水平为1α单侧置信区间θ称为θ的置信水平为1α单侧置信下限
  2. 单侧置信上限:对于给定值α(0<α<1),如果由样本X1,X2,,Xn确定的统计量θ=θ(X1,X2,,Xn),θΘ满足P(θ<θ)=1α,成随机区间(,θ)θ的置信水平为1α单侧置信区间θ称为θ的置信水平为1α单侧置信上限

2. 常见单侧置信区间


__EOF__

本文作者RadiumGalaxy
本文链接https://www.cnblogs.com/RadiumGalaxy/p/16974392.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。您的鼓励是博主的最大动力!
posted @   RadiumStar  阅读(221)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示