Begtostudy(白途思)'s Professional Technology Blog

欢迎访问begtostudy的专业知识博客!主要是专业技术和算法为主。
  首页  :: 联系 :: 订阅 订阅  :: 管理

数理统计与Matlab: 第2章 参数估计

Posted on 2012-06-22 09:56  白途思  阅读(1978)  评论(0编辑  收藏  举报

2.1 点估计

点估计:对于给定的总体和样本,如果用某个统计量的值估计总体的某个未知参数,这种估计方法称为点估计,该统计量称为点估计量。例如用样本均值估计总体均值,用样本方差估计总体方差,都属于点估计。

常用的求点估计量的方法有:矩估计法、最大似然估计法,是考研究生要求掌握的方法,常用教材都有详细叙述。

对于同一个未知参数,常有多种估计方法,如何选择?这涉及到估计量的评价标准。常从以下三个不同角度考察。

2.1.1 无偏性

定义1.5 设总体含有未知参数为来自总体的简单随机样本,又设的一个估计量。若在给定范围内无论如何取值,总有,则称的一个无偏估计量;若,则称的一个有偏估计量

注意无偏估计的含义是:由于样本的随机性,估计值有时候偏大,有时候偏小,多次估计的平均值才能靠近真实的未知参数值。

无论无偏估计还是有偏估计,可以统一使用"均方误差"MSE评价:

(2-1)

对于无偏估计,,但可能很大,果真如此,它就不是一个好的估计量。反之,对于有偏估计,虽然,但如果与相加之后仍然较小,则它就是一个较好的估计量。

例2.1 设总体为来自总体的简单随机样本,欲估计总体均值(注意未知),比较以下三个点估计量的好坏:

本例题给出了利用MSE评价点估计量的随机模拟方法。由于的总体均值为,因此我们可以先取定一个固定值,例如,然后在这个参数已知且固定的总体中抽取容量为20的样本,分别用样本值依照三种方法分别计算估计值(注意谁也别偷看底牌),看看哪种方法误差大,哪种方法误差小。一次估计的比较一般不能说明问题,正如低手射击也可能命中10环,高手射击也可能命中9环。如果连续射击1万次,比较总环数(或平均环数),多者一定是高手。同理,如果抽取容量为20的样本次,分别计算

小者为好。

N=10000; m=5; n=20;

mse1=0; mse2=0; mse3=0;

for k=1:N

x=chi2rnd(m,1,n);

m1=101*x(1)-100*x(2);

m2=median(x);

m3=mean(x);

mes1=mse1+(m1-m)^2;

mes2=mse2+(m2-m)^2;

mes3=mse3+(m3-m)^2;

end

mse1=mes1/N

mse2=mes2/N

mse3=mes3/N

以上程序保存为ex21.m,命令窗口中键入ex21,运算结果为

mse1 =

58.1581

mse2 =

7.8351e-005

mse3 =

9.4469e-006

可见第一个虽为无偏估计量,但MSE极大,表现很差。第二个虽为有偏估计,但表现与第三个相差不多,也是较好的估计量。另外,重复运行ex21,每次的结果是不同的,但优劣表现几乎是一致的。

例2.2为来自上服从均匀分布的总体的简单随机样本,容易得到未知参数的矩估计量,最大似然估计量,试用随机模拟的方法比较两者的优劣。

不妨设,以下程序给出了两者的评价。

s=5;

N=10000;

mse1=0; mse2=0;

for k=1:N

x=5.*rand(1,50);

s1=2*mean(x);

s2=max(x);

mse1=mse1+(s1-s)^2;

mse2=mse2+(s2-s)^2;

end

mse1=mse1/N; mse2=mse2/N;

[mse1,mse2]

参考运行结果: 0.1655 0.0186

本例中,最大似然估计精度较高。注意矩法估计量是无偏估计,本例中最大似然估计量显然是有偏估计,且一定是偏小的。

2.1.2 有效性

对于无偏估计,在中第二项为零,故比较两个无偏估计量,只需比较各自的方差即可。称方差小的无偏估计量为有效的,当然指的是两个无偏估计相对而言。

2.1.3 相合性

为总体未知参数的估计量,如果对于任意给定的,总有

(2-2)

则称相合估计量。又若

(2-3)

则称强相合估计量

相合估计的含义是:样本容量越大,估计值越精确。

2.2 区间估计

所谓区间估计,就是用两个估计量估计未知参数,使得随机区间能够包含未知参数的概率为指定的。即:

称满足上述条件的区间的置信区间,称为置信水平。称为置信下限,称为置信上限。

2.2.1 单正态总体均值的置信区间

(1)方差已知情形

查表求满足:对于

对于总体中的样本的置信区间为:

(2-4)

其中可以用norminv(1-a /2)计算。

例2.3

1.1, 2.2, 3,3, 4.4, 5.5

为来自正态总体的简单随机样本,求的置信水平为95%的置信区间。

以下用Matlab命令计算:

x=[1.1,2.2,3.3,4.4,5.5];

n=length(x);

m=mean(x);

c=2.3/sqrt(n);

d=c*norminv(0.975);

a=m-d; b=m+d;

[a,b]

计算结果为 1.2840 5.3160

(2)方差未知情形

对于总体中的样本的置信区间为:

(2-4)

其中为自由度分布临界值。

数据同上,继续利用Matlab计算

S=std(x); dd=S*tinv(0.975,4)/sqrt(n);

aa=m-dd; bb=m+dd; [aa,bb]

结果为 1.1404 5.4596

2.2.2 单正态总体方差的置信区间

由于,查表求临界值,使得

的置信区间为

(2-5)

其中查表可用chi2inv进行。数据同上,以下求的置信区间。

c1=chi2inv(0.025,4);

c2=chi2inv(0.975,4);

T=(n-1)*var(x);

aaa=T/c2; bbb=T/c1;

[aaa,bbb]

计算结果为 1.0859 24.9784

2.2.3 两正态总体均值差的置信区间

(1)方差已知情形

,两样本独立,此时的置信区间为

(2-6)

这里我们已经知道可用norminv(0.975)求得,Matlab计算很容易。

(2)方差未知但相等:

此时的置信区间为

(2-7)

其中,而依照自由度计算。

2.2.4 两正态总体方差比的置信区间

此时,查自由度为分布临界值表,使得

的置信区间为:

(2-7)

例2.4 设两台车床加工同一零件,各加工8件,长度的误差为:

A:-0.12 -0.80 -0.05 -0.04 -0.01 0.05 0.07 0.21

B:-1.50 -0.80 -0.40 -0.10 0.20 0.61 0.82 1.24

求方差比的置信区间。

用Matlab计算如下:

x=[-0.12,-0.80,-0.05,-0.04,-0.01,0.05,0.07,0.21];

y=[-1.50,-0.80,-0.40,-0.10,0.20,0.61, 0.82,1.24];

v1=var(x); v2=var(y);

c1=finv(0.025,7,7); c2=finv(0.975,7,7);

a=(v1/v2)/c2; b=(v1/v2)/c1; [a,b]

计算结果为: 0.0229 0.5720

方差比小于1的概率至少达到了95%,说明车床A的精度明显高。

 

前往Begtostudy的编程知识博客(CSDN)