sufficient statistic

充分统计量

 编辑
统计量是样本数据的函数,在统计学中,T(x) 为未知分布P的参数θ的充分统计量,当且仅当T(x)可以提供θ的全部信息,也就是说,没有统计量可以提供关于θ的额外信息。
统计量是实际上是一种对数据分布的压缩,在样本加工为统计量的过程中,样本中所含的信息可能有所损失,若在将样本加工为统计量时,信息毫无损失,则称此统计量为充分统计量。比如,在正态分布中, 我们可以用两个充分统计量统计量样本均值样本方差描述整个数据分布。
中文名
充分统计量
外文名
Sufficient statistics
相关变量
T(x)
特    点
统计充分

目录

数学定义编辑

统计量
  
是未知数据分布P参数
  
的充分统计量,当且仅当,样本数据集
  
关于统计量
  
条件分布,独立于
  
更一般的,未知参数
  
可以是一组未知的参数向量,这种情况下,
  
对应一组函数集合,称为联合统计量。

直观理解编辑

统计量是数据的函数。函数就是一种”浓缩“信息的动作。因此, 统计量中所包含的信息, 通常比整个样本数据所包含的来得少。例如样本的顺序统计量只包含了有哪些值出现, 而不同值出现的次序这样的信息不见了。
但统计量比样本原数据少掉的信息可能是无关紧要的 —— 和我们要了解的群体特性不相干, 比如样本数据出现顺序在很多时候和我们关心的群体特性无关。若在将样本加工为统计量时,信息毫无损失,则称此统计量为充分统计量。在参数化模型, 比如正态分布,我们可以用样本平均数样本方差这两个很简单的统计量囊括样本中所包含的全部信息。
一个随机变量的分布,取决于一些参数的值;充分统计量能够完全捕捉这些参数所包含的关于分布的信息。
posted @ 2015-11-22 12:59  StevenLuke  阅读(268)  评论(0编辑  收藏  举报