Financial - 置信区间 (Confidence Interval,CI)

回到顶部(go to top)

总结

1.一些前置概念

置信区间是谁的置信区间?--> 置信区间是参数的置信区间

参数又是什么的参数?--> 参数是总体(population)的参数

置信区间是怎么算的?--> 是通过样本(sample)算的

 

2.正确理解置信区间

95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你算出来的区间可以包括真实参数值。

真实参数值(也就是总体参数),是一个常数,只是你不知道,是unknown constant,不知道不代表随机,完全两个概念

 

 

 

回到顶部(go to top)

详细文章

看了下前面几个答案,写的不短,赞的人也不少,但是完全没觉得讲清楚什么是置信区间,甚至好多错误观点。

最可能出现的对置信区间的错误理解:

95%置信区间有95%的概率包括真实参数

 

。以前在学校教过应用统计,所以我来给个简明专业的答案吧:

理解置信区间,有几个基础统计概念要搞清楚,抛开这些概念去理解置信区间就是扯淡。置信区间是谁的置信区间?这个问题搞清楚了么,置信区间是来参数的置信区间,参数又是什么的参数?
参数是总体(population)的参数,置信区间是怎么算的?是通过样本(sample)算的,样本和总体又有什么联系?
1)总体,就是全部数据。可以假设总体服从某一分布,比如正太分布。一个正太分布是由两个参数唯一确定的,平均值和方差,这两个参数都是固定的数值,而不是变化的。
2)(随机)样本,样本就是从总体里面得到的数据,比如从一个正太分布,我们可以得到0.54,这个0.54就是一个样本。很重要的一点:一个样本未必只有一个值,我们完全可以得到一个样本(0.1,-5,12),这个样本有3个值,3 就是这个样本的size。
3)参数估计,实际中,总体什么分布往往不知道,但是我们可以做假设,比如假设人的体重是正太分布,做了这个假设,那接下来的问题是这个正太分布参数是多少?也就是平均值和方差怎么算,解决这个问题就是参数估计,统计里有很多方法,不展开说了。但是参数估计是从样本来估计的,这是关键的一点:样本——>总体的参数。
4)不同样本估计的参数一样么?没有理由一样,所以问题来了,不同样本估计的总体不一样,怎么办?区间估计,也就是给定一个区间,让总体参数被包括其中。但是总体参数一定被包括么?显然也不一定,这取决于样本,如果恰好选了某些样本,可能估计的参数和总体相距甚远。

最后一点,也是最重要一点,很多自称搞统计的人也理解错误,就是怎么解释置信区间呢?
5)比如给定一组参数,算出来总体平均值的置信区间[a,b],是不是说总体平均值有95%的概率在这个区间内?这样理解是逻辑混乱的结果,没搞懂什么是常数,什么是随机变量这些基本问题。
首先,总体参数,是一个常数,只是你不知道,是unknown constant,不知道不代表随机,完全两个概念。然后,一旦估计出区间,这区间也是确定的,参数也是确定的,不存在任何随机问题,那么现在大家应该清楚答案最开始说对置信区间最大的误解”95%置信区间有95%的概率包括真实参数“的问题在哪了。

那么正确的解释是怎样的?可以有很多种,这里直说一个解释:
95%置信区间,意味着如果你用同样的步骤,去选样本,计算置信区间,那么100次这样的独立过程,有95%的概率你算出来的区间可以包括真实参数值。

下图就是一个例子,抽样100次,计算总体参数的置信区间100次,多数情况置信区间覆盖了真实值,但是也有没有的情况。


一个类比,对置信区间包括真实参数的概率的错误理解相当于说守株待兔,已经选好一棵树,兔子撞上去的概率,兔子就是真是参数。正确的理解是,找到一棵有兔子的树的概率。树是什么?是样本,也是置信区间。

差别有些微妙!

 

 

回到顶部(go to top)

参考文献

征服统计学10|什么是95%置信区间?https://zhuanlan.zhihu.com/p/341768542

https://www.pianshen.com/article/409088316/  搜索关键字“置信区间是随机变量”

 

posted on   frank_cui  阅读(92)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
历史上的今天:
2023-02-01 线性代数 - 如何正确理解主成分分析(PCA)和奇异值分解(SVD)
2023-02-01 线性代数 - 如何正确理解特征值与特征向量
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

导航

统计

levels of contents
点击右上角即可分享
微信分享提示