为什么样本方差除以(n-1)而不是n ?(自由度)
不记得第几次看见样本方差的公式,突然好奇为什么要除以n-1
而不是n
呢?看见一篇文章从定义上和无偏估计推导上讲的很清楚https://blog.csdn.net/fuming2021118535/article/details/51290320,书上看见从自由度上作的解释,在此记录一下。
自由度
自由度是统计学中一个经常见到的重要概念。指计算某一统计量时,取值不受限制的变量个数。
对于样本方差来说,自由度为n-1
。的表达式中为n
个量的平方和,为何自由度只有n-1
?
因为, ..., 这n
个量并不能自由变化,而是受到一个约束,即,这使它的自由度少了一个,在样本方差的公式中分母上是n-1
,就是因为当给定均值时,这n
个数据中,前n-1
个数据都可以自由取值,而第n
个数据受到全部数据的平均值的约束,不能自由取值。第n
个数据可由公式求得,因此,的自由度是n-1
。所以,所谓自由度就是指可以自由取值的数据的个数,或者指不受任何约束,可以自由变动的变量的个数。
还可以对自由度这个概念赋予另一种解释,即一共有n
个数据,有n
个自由度,用估计总体方差,自由度本应为n
,但总体均值μ
也未知,用去估计,用掉了一个自由度,故只剩n-1
个自由度。
用矩阵秩的概念也可以解释自由度。自由度是对随机变量的二次型(可称为二次统计量)而言的,自由度就是二次型矩阵的秩。但用矩阵的秩来判断统计量的自由度比较困难,一般采用直观方法来做判断,即由线性代数知识可知,一个二次型的秩为它所含变量个数减去变量间独立线性约束条件的个数,从而便可得到统计量的自由度。关于样本方差的自由度,就是因为含有n
个变量,但n
个变量有一个线性约束条件,故的自由度为n-1
。
回归分析中,回归方程的显著性检验用到残差平方和。确定残差平方和的自由度的一般方法是:观测值的个数n
减去必须估计出的参数的个数就是自由度。例如p
元线性回归方程的残差平方和的自由度就是n-p-1
,因为回归方程中有p+1
个待估参数。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?