偏度和峰度
偏度(skewness)
偏度是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。
定义上偏度是样本的标准三阶中心矩(standardized 3rd central moment)。
\[Skew(X)=E[(\frac{X-\mu}{\sigma})^3]=\frac{k_3}{\sigma^3}=\frac{k_3}{k_2^{\frac{3}{2}}}
\]
偏度用于衡量数据的对称性。若偏度为负,则数据均值左侧的离散度比右侧强;若偏度为正,则数据均值左侧的离散度比右侧弱。对于正态分布(或严格对称分布)偏度等于 0。
如果Skewness>0,代表波形有右侧长尾;如果Skewness<0 代表波形有左侧长尾。
峰度(kurtosis)
峰度又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。
定义上峰度是样本的标准四阶中心矩(standardized 4rd central moment)。
随机变量的峰度计算方法为随机变量的四阶中心矩与方差平方的比值。
\[Kurt(X)=E[(\frac{X-\mu}{\sigma})^4]=\frac{E[(X-\mu)^4]}{(E[(X-\mu)^2])^2}
\]
峰度是描述总体中所有取值分布形态陡缓程度的统计量。
这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。
【参考】