数据挖掘——统计学分析(五:统计量)

统计量

通过从总体中抽取样本构造适当的统计量,由样本性质推断总体性质的样本函数。


常用的统计量

1)样本均值

2)样本方差、标准差

3)样本的变异系数——C=根号(D(x))/E(x)

4)k阶距

5)中心距

6)样本偏度

7)样本峰度

注:偏度、峰度在质量控制和可靠性研究应用较多。

次序统计量

参数估计和假设检验的重要统计量。

1)最小、最大次序统计量

2)样本极差=最大统计量-最小统计量

3)中位数、分位数、四分位数

充分统计量

统计量加工过程中一点信息都不损失的统计量称为充分统计量。

关于分布的几个概念

抽样分布

总体的分布类型已知,则对于任一自然数n,都能导出统计量的分布数学表达式。精确的分布大多实在正态总体情况下得到的。

渐进分布

当抽样分布的n较大时,就用极限分布作为抽样分布的一种近似,这种极限分布称为渐进分布。

随机模拟获得的近似分布

通过反复的重复试验得到的观测值满足的分布。

由正态分布导出的几个重要分布

卡方分布

t分布

F分布

在方差分析、回归方程的显著性检验中有着重要的地位。

 

 


posted @ 2018-10-05 08:40  程序媛墨禾  阅读(650)  评论(0编辑  收藏  举报