Begtostudy(白途思)'s Professional Technology Blog

欢迎访问begtostudy的专业知识博客!主要是专业技术和算法为主。
  首页  :: 联系 :: 订阅 订阅  :: 管理

第七章 参数估计

Posted on 2011-03-16 18:18  白途思  阅读(1609)  评论(0编辑  收藏  举报

参数估计就是要从样本出发构造一些统计量作为总体某些参数(或数字特征)的估计量。

 

点估计就是构造统计量。

j=1,2,…n

的值作为的近似值。对进行估计,叫(点)估计量。若样本值代入称为的估计值。

 

区间估计是根据样本构造出适当的区间,它以一定的概率包含未知参数。

 

§7.1 点估计

 

(一)矩估计法

1.矩估计法的基本思想

在总体的各阶矩存在的条件下,用样本的各阶矩去估计总体相应的各阶矩,又由于总体的分布类型已知,总体的各阶矩可表示为未知参数的已知函数,这样样本的各阶矩就与未知参数的已知函数联系起来,从而得到参数的各阶矩。

 

2.一般求法

 =1,2…k

=1,2…k

‚ =1,2…k

ƒ代入中, =1,2…k

 

 

例 2 P159总体X~U[a,b],参数a,b未知,求a,b的矩估计。

 

例 3 P160

 

 

以下为第一版例。

 

例7:总体X~U[0,b],参数b未知,求b的矩估计。

 

例8:总体未知,已知 是来自总体X的样本值,求的矩估计。

 

例9:总体的概率密度为

参数 均未知, 是来自总体的样本,求的矩估计。

 

3.总体的数学期望与方差的矩估计

已知总体的二阶矩存在, 是来自总体的样本值。E(X),D(X)的矩估计是

注意: 此结论用于只要E(x)、D(x)存在的,不论分布是否已知的各类型总体的数字特征E(X)、D(X)的矩估计。

 

例:总体X~B(N,p), 参数N、0<p<1均未知,已知 是来自总体的样本值,求N,p的矩估计 。

 

 

(二) 最大似然估计法

  1. 最大似然估计法的基本思想

例:设在一个口袋中装有许多白球和黑球,但不知是黑球多还是白球多,只知道两种球的数量之比为1:3就是说抽取到黑球的概率

 

如果用有放回抽取的方法从口袋中抽取n=3个球,发现有一个是黑球,试判断p=?。

 

X

0

1

2

3

时,P(取的三个球中有一个黑球)=大。选取参数总体较合理。故取p的估计值

最大似然估计基本思想:根据样本的具体情况,选择参数p的估计,使得该样本发生的概率最大。

 

2.最大似然估计的求法

设总体的形式已知,参数未知(j=1,2…m), 是来自总体的样本值。

,选择参数的估计,使样本取值附近的概率

=

= 达到最大,

等价使 达到最大。

称L=L()=为样本值的似然函数。

 

定义7.1如果似然函数L=L()在达到最大值,则称分别为的最大似然估计。

 

2.一般步骤

(1).当似然函数可微且参数集合是开集的条件下:

  • 总体

i =1,2…n

L=L()=

取对数

 ②

 ③由似然方程解出=?.。讨论是最大值点,则它是的最大似然估计。

 

例4 P162 ,求未知参数 的最大似然估计。

 

例 5 P163 总体未知, 已知 是来自总体X的样本值,求的最大似然估计。

 

例 6 P165 总体X~U[a,b],参数a,b未知, 已知 是来自总体的样本值,求b的最大似然估计。

 

 

 

以下为第一版例。

例2:总体=

参数未知, 是来自总体的样本值,求的最大似然估计。

例3:,求未知参数 的最大似然估计。[见书P159,例7.1]

总体X是离散值,一定要写出X的概率函数。

例4:一个罐子里装有黑球和白球,每次从中随机的有放回地抽取一个球,直到抽到黑球为止。设停止抽球时所需抽取数是X,这样独立重复的进行了n次实验,获得样本,试求罐子里黑球所占的比例中的最大似然估计。

 

例5:X服从参数为的威布尔分布,而

=

m>0,>0且未知, 是来自总体的样本值,求参数的最大似然估计。

 

(2)当似然函数L不可数时,或似然函数无解,要用定义求参数的最大似然估计。

例6:总体X~U[0,b],参数b未知, 已知 是来自总体的样本值,求b的最大似然估计。

 

3.未知参数的已知函数的最大似然估计有如下规定:

,未知参数的已知函数为分别为的最大似然估计,则规定g()为g()的最大似然估计。

例:P习题7.5。

 

 

§7.2 估计量评选标准

 

1.无偏性:

定义:设()是的估计量,若E()=,对一切,则称的无偏估计量,否则称为的有偏估计量。其偏差度为= E()-。如果 E()=,则称的渐近无偏估计量。

 

书上定义是对g()而言的:

定义:设未知参数的已知函数g()的估计量为,如果对一切都有

则称的无偏估计量。

 

例10:设总体有二阶矩,E(X)=,D(X)=存在,是该总体的样本,证明的无偏估计,的无偏估计,但不是的无偏估计,是的渐近无偏估计。

 

例11:总体X~U[a,b],b>0,试问b的矩估计是否是b的无偏估计量。

注意:

(1)若的无偏估计,g()为的已知函数,而g()不一定是g()的无偏估计。

(2)有时的有偏估计也可稍加修改为无偏估计。

例:设的无偏估计,但不是

的无偏估计,可修改为它是的无偏估计。

2.有效性

定义:若都为的无偏估计量。若 且至少对一个,有严格不等号成立,则称有效。

例12:比较,()。估计,哪个有效。

定义:设都是g()的估计量, 如果对一切都有

 -g()]- g()]

且存在,有严格不等号成立,则称有效。

此定义为均方误差准则。

3.相合性(一致估计量)

定义7.5:设g()的估计量为,如果对任意的>0,都有

=1

则称的相合估计量。

 

§7.2 区间估计

一.基本概念

, 是两个统计量,且满足,则称[A,B]为一随机区间。

 

定义7.6:对于给定的正数,如果对一切都有

则称[A,B]为的置信度为的置信区间,称为置信区间的置信度,称A、B分别为置信下限和置信上限。

常用的形式:

    

 

例:某旅游社为调查当地每一旅游者的平均消费额,随机访问了100名旅游者,得知平均消费额(元)。根据经验,已知旅游者消费额服从正态分布,且标准差(元),那麽该地旅游者平均消费额的置信度为95%的置信区间是什麽。

设旅游者消费额为,且知,此题是求的置信区间的问题。

(1)找的较好点估计(最大似然估计或无偏估计),

(2)为使,要选有关的函数且知其分布。当已知时,

 

为枢轴变量。对给定的,使

(3)将不等式 等价变形

本例,计算

得到,当地每位旅游者置信度为95%的平均消费额在[77.6元,82.4元]之间。

 

Data;

u=probit(1-0.05/2);put u=;

A=80-(u*12)/sqrt(100); put A=;

B=80+(u*12)/sqrt(100); put B=;

run;

 

u=1.9599639845

A=77.648043219

B=82.351956781

 

 

定义:叫区间半径,叫区间中心,

叫区间长度。

 

 

二.置信区间的一般求法 (枢轴量法)

(1)从的一个较好点估计出发,构造的一个函数 ,且知其分布又与无关,函数H称为枢轴变量。

(2)记H的上分为数和上(1-)分位数为,使对给定的,有

利用不等式运算,将不等式

进行等价变形,使得最后得到形如:

的不等式。

就是置信区间,这时有:

定义:叫区间半径,叫区间长度。

 

例1 P170,计算机实现过程。

 

Data;

z=probit(1-0.05/2);put z=;

A=5.2-(z*1)/sqrt(16); put A=;

B=5.2+(z*1)/sqrt(16); put B=;

C=B-A; put C=;

run;

z=1.9599639845

A=4.7100090039

B=5.6899909961

C=0.9799819923

 

P171页下面部分的数值解释。

Data;

u1=probit(0.04);put u1=;

u2=probit(1-0.01);put u2=;

 

A=5.2+(u1*1)/sqrt(16); put A=;

B=5.2+(u2*1)/sqrt(16); put B=;

C=B-A; put C=;

run;

u1=-1.750686071

u2=2.326347874

A=4.7623284822

B=5.7815869685

C=1.0192584863

 

 

 

三.正态总体的参数的区间估计

1.一个正态总体的均值、方差的置信区间

设总体是来自总体的样本

(1)已知,均值的置信度为的置信区间为:

(2)未知,均值的置信度为的置信区间为:

(3)未知,方差的置信度为的置信区间为:

的置信区间为:

 

  1. 两个正态总体均值差方差比的置信区间

 

总体

样本

均值

样本方差

两个样本相互独立。

(1)已知,均值差的置信区间为

(2)未知,但的置信区间为

[]

(3)未知,方差比的置信区间为:

[]

(4) 已知,的置信区间为:

[]

 

 

  1. P174

 

 

Data;

t=TINV((1-0.05/2),15); put t=;

A=503.75-t*6.2022/sqrt(16); put A=;

B=503.75+t*6.2022/sqrt(16); put B=;

C=B-A; put C=;

run;

t=2.1314495456

A=500.44508091

B=507.05491909

C=6.6098381857

 

例2 P175

Data;

 

k1=CINV(1-0.05/2, 15);put k1=;

k2=CINV(0.05/2, 15);put k2=;

 

A=sqrt(15)*6.2022/sqrt(k1); put A=;

B= sqrt(15)*6.2022/sqrt(k2); put B=;

C=B-A; put C=;

run;

k1=27.488392863

k2=6.262137795

A=4.5815952687

B=9.5990905015

C=5.0174952328

 

例 3 P177

Data;

t=tINV(1-0.05/2, 28);put t=;

sw=sqrt((9*1.1**2+19*1.2**2)/28); put sw=;

A=500-496-sw*t*sqrt(1/10+1/20); put A=;

B=500-496+sw*t*sqrt(1/10+1/20); put B=;

C=B-A; put C=;

run;

 

t=2.0484071418

sw=1.1687905837

A=3.0727462146

B=4.9272537854

C=1.8545075707

 

例 4 P177

 

Data;

t=tINV(1-0.05/2, 14);put t=;

sw=sqrt((7*3.89+7*4.02)/14); put sw=;

A=91.73-93.75-sw*t*sqrt(1/8+1/8); put A=;

B=91.73-93.75+sw*t*sqrt(1/8+1/8); put B=;

C=B-A; put C=;

run;

t=2.1447866879

sw=1.9887181801

A=-4.152688139

B=0.1126881394

C=4.2653762788

 

例 5 P179

 

data ;

F1=FINV(1-0.1/2, 17,12) ; put F1=;

F2=FINV(0.1/2, 17,12) ; put F2=;

A=0.34/(0.29*F1); put A=;

B=0.34/(0.29*F2); put B=;

C=B-A; put C=;

Run;

F1=2.5828389059

F2=0.4200526125

A=0.4539244745

B=2.7911117756

C=2.3371873011

 

§7.5 (0---1)分布参数的区间估计

 

P179

 

例 P180

data;

z=probit(1-0.05/2);put z=;

a=100+z**2; put a=;

b=-(2*100*0.6+z**2); put b=;

c=100*0.6**2; put c=;

p1=1/(2*a)*(-b-sqrt(b**2-4*a*c)); put p1=;

p2=1/(2*a)*(-b+sqrt(b**2-4*a*c)); put p2=;

p=p2-p1; put p=;

run;

 

z=1.9599639845

a=103.84145882

b=-123.8414588

c=36

p1=0.5020025868

p2=0.6905987136

p=0.1885961268

 

 

 

§7.6 单侧置信区间

 

对于均值,单侧置信区间下限。公式(6.4)

对于方差,单侧置信区间上限。公式(6.6)

 

例 P182

 

Data;

t=tINV(1-0.05, 4);put t=;

mu=1160-sqrt(9950/5)*t; put mu=;

run;

t=2.1318467863

mu=1064.8995598

 

习题:

1,2,3,5,6,10,14,15,19,25

前往Begtostudy的编程知识博客(CSDN)