均值,中值,标准差,方差,正态分布等名词术语

均值:表示一系列数据或统计总体的平均特征的值。

统计学术语,与“平均”(Average)意义相同。例如: l、3、6,10、20这5个数的均值是8。也同期望。

 

中值[midpoint]

  组距的上下限之算术平均数   [median] 是在一组数据中居于中间的数(特别注意的地方是:这组数据之前已经经过升序排列!!!),即在这组数据中,有一半的数据比它大,有一半的数据比它小。如果这组数据包含偶数个数字,中值是位于中间的两个数的平均值。

 

标准离差 = 标准差 = 均方差

标准差(Standard Deviation) ,也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同

http://baike.baidu.com/view/1024670.htm

标准计算公式   假设有一组数值X1,X2,X3,......Xn(皆为实数),其平均值为μ,公式如图1.

  图1

图1

  标准差也被称为标准偏差,或者实验标准差,公式如图2。

 

图2

 *(在window7自带的计算器中有个统计模式)其中这个符号就是计算标准差

 

 

概率密度的数学定义

  对于随机变量X,若存在一个非负可积函数p(x)(﹣∞ < x < ﹢∞),使得对于任意实数a, b(a < b),都有(公式如右图)

则称p(x)为X的概率密度。

 

正态分布

正态分布(normal distribution)又名高斯分布(Gaussian distribution),正态分布是一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差, 所以正态分布记作N(μ,σ2 )。遵从正态分布的随机变量的概率规律为取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正 (负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x 轴上方的钟形曲线。 当μ=0,σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元 正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。。

正态分布的特征:

1、集中性:正态曲线的高峰位于正中央,即均数所在的位置。

  2、对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

  3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

  4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。

  5、u变换:为了便于描述和应用,常将正态变量作数据转换

http://wiki.mbalib.com/wiki/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83

 

方差

方差是各个数据与平均数之差的平方的平均数。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。

http://baike.baidu.com/view/172036.htm

  如下面的例子:   已知某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图:   甲仪器测量结果:

乙仪器测量结果:

两台仪器的测量结果的均值都是 a 。但是用上述结果评价一下两台仪器的优劣,很明显,我们会认为乙仪器的性能更好,因为乙仪器的测量结果集中在均值附近。

 

posted @ 2012-11-19 16:44  音乐啤酒  阅读(15714)  评论(0编辑  收藏  举报