置信区间(Confidence Interval)

转载

一直做着的不确定性分析,很多时候会涉及到置信区间的概念,但一直没能有个清晰的认识,今天终于从网上查资料,具体核实了置信区间的含义。

  95%置信区间(Confidence Interval,CI):当给出某个估计值的95%置信区间为【a,b】时,可以理解为我们有95%的信心(Confidence)可以说样本的平均值介于a到b之间,而发生错误的概率为5%。 

  有时也会说90%,99%的置信区间,具体含义可参考95%置信区间。

  置信区间具体计算方式为:

  (1)知道样本均值(M)和标准差(ST)时:

  置信区间下限:a=M - n*ST;     置信区间上限:a=M + n*ST; 

  当求取90% 置信区间时 n=1.645  

  当求取95% 置信区间时 n=1.96

  当求取99% 置信区间时 n=2.576

  (2)通过利用蒙特卡洛(Monte Carlo)方法获得估计值分布时:

  先对所有估计值样本进行排序, 置信区间下限:a为排序后第lower%百分位值;     置信区间上限:b为排序后第upper%百分位值.

  当求取90% 置信区间时 lower=5  upper=95;

  当求取95% 置信区间时 lower=2.5  upper=97.5

  当求取99% 置信区间时 lower=0.5  upper=99.5

  当样本足够大时,(1)和(2)获取的结果基本相等。

  参考资料:http://140.116.72.80/~smallko/ns2/confidence_interval.htm 

  

   附刚准备MATLAB 求取置信区间源码:

  ……………………………………………………………………………………………………………………

%%% 置信区间的定义90%,95%,99%
clear
clc
sampledata=randn(10000,1);
a=0.01; %0.01 对应99%置信区间, 0.05 对应95%置信区间 ,0.1 对应90%置信区间
if a==0.01
    n=2.576; % 2.576 对应99%置信区间, 1.96 对应95%置信区间 ,1.645 对应90%置信区间
elseif a==0.05
    n=1.96;
elseif a==0.1
    n=1.645;
end
%计算对应百分位值
meana=mean(sampledata);
stda=std(sampledata);
sorta=sort(sampledata);  %对数据从小到大排序
leng=size(sampledata,1);
CIa(1:2,1)=[sorta(leng*a/2);sorta(leng*(1-a/2))];
%利用公式计算置信区间
CIf(1:2,1)=[meana-n*stda;meana+n*stda];

posted @ 2015-12-30 10:16  hanny  阅读(9316)  评论(0编辑  收藏  举报