sufficient statistic
-
充分统计量
编辑
统计量是样本数据的函数,在统计学中,T(x) 为未知分布P的参数θ的充分统计量,当且仅当T(x)可以提供θ的全部信息,也就是说,没有统计量可以提供关于θ的额外信息。
- 充分统计量
- Sufficient statistics
- T(x)
- 统计充分
目录
数学定义编辑
直观理解编辑
统计量是数据的函数。函数就是一种”浓缩“信息的动作。因此, 统计量中所包含的信息, 通常比整个样本数据所包含的来得少。例如样本的顺序统计量只包含了有哪些值出现, 而不同值出现的次序这样的信息不见了。
但统计量比样本原数据少掉的信息可能是无关紧要的 —— 和我们要了解的群体特性不相干, 比如样本数据出现顺序在很多时候和我们关心的群体特性无关。若在将样本加工为统计量时,信息毫无损失,则称此统计量为充分统计量。在参数化模型, 比如正态分布,我们可以用样本平均数和样本方差这两个很简单的统计量囊括样本中所包含的全部信息。
一个随机变量的分布,取决于一些参数的值;充分统计量能够完全捕捉这些参数所包含的关于分布的信息。