95% CI, 置信区间 Confidence Interval

什么是置信区间

  置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)。

 

置信区间的概述

1、对于具有特定的发生概率的随机变量,其特定的价值区间:一个确定的数值范围(“一个区间”)。     

2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。                                     

3、该区间包含了参数θ真值的可信程度。                                 

4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。

 

关于置信区间的宽窄

  窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。

  假设全班考试的平均分数为65分,则置信区间、间隔、宽窄度、表达的意思是:

  0-100分 100 宽 等于什么也没告诉你

  30-80分 50 较窄 你能估出大概的平均分了(55分)

  60-70分 10 窄 你几乎能判定全班的平均分了(65分)

 

置信区间与置信水平、样本量的关系

  1、样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。

  实例分析:

  经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):

样本量

置信区间

间隔

宽窄度

100

50%-70%

20

800

56.2%-63.2%

7

较窄

1,600

57.5%-63%

5.5

较窄

3,200

58.5%-62%

3.5

更窄

  由上表得出:

  1、在置信水平相同的情况下,样本量越多,置信区间越窄。

  2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了1,200个消费者),就不再增加样本了。

  通过置信区间的计算公式来验证置信区间与样本量的关系

  置信区间=样本的推断值±(可靠程度系数× )

  从上述公式中可以看出:

  1、在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。

  2、置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。

  实例分析:

  美国做了一项对总统工作满意度的调查。在调查抽取的1,200人中,有60%的人赞扬了总统的工作,抽样误差为±3%,置信水平为95%;如果将抽样误差减少为±2.3%,置信水平降到为90%。则两组数字的情况比较如下:

抽样误差

置信水平

置信区间

间隔

宽窄度

±3%

95%

60%±3%=57%-63%

6

±2.3%

90%

60%±2.3%=57.7%-62.3%

4.6

  由上表得出:

  在样本量相同的情况下(都是1,200人),置信水平越高(95%),置信区间越宽。

 

通俗的讲:OR值是点估计,可信区间是区间估计。可信区间包含1,表示该因素对疾病的发生不起作用;可信区间大于1,表示该因素是一个“危险”因素。例如天气预报预计在10-20'C及15-16'C之间(95%可行度),则后者较前者可信度高。实际测定若为15.5'C,均落在2个可行度之间,说明可靠;若为25'C,落95%可行度之外,说明不可靠,处于5%的几率。95%上线位于左,下线位于右。

 

来源:http://wiki.mbalib.com/wiki/置信区间

posted @ 2018-06-28 16:56  nkwy2012  阅读(31638)  评论(0编辑  收藏  举报