弗里德曼-迪亚科尼斯规则,偏度,峰度

弗里德曼-迪亚科尼斯规则

在统计学中,Freedman-Diaconis规则用于确定直方图中的条柱宽度, 它以David A.Freedman和Persi Diaconis的名字命名。该规则定义:

=2×IQRn3

其中,IQR是四分位距,n是观测样本数目。

偏度(Skewness)

偏度用来度量随机变量概率分布的不对称性。

b1=m3s3=1ni=1n(xμ)3[1n1i=1n(xμ)2]3/2

g1=m3m23/2=1ni=1n(xμ)3[1ni=1n(xμ)2]3/2

其中,μ是样本均值,s是样本标准差,m2是(偏置)样本的第二中心矩,m3是样本的第三中心矩。

样本偏度的另外一个定义是:

G=k3k23/2=n2(n1)(n2)b1=n(n1)n2g1

偏度是一种统计描述,可与直方图和正态分位数图结合使用,以表征数据或者分布。

偏度表示分布与正态分布的偏差的方向和相对大小。

偏度的取值范围:(,)

当偏度<0时,概率分布偏左。

当偏度=0时,数据分布服从正态分布。

当偏度>0时,概率分布右偏。

皮尔逊第一偏度系数(众数偏度)

皮尔逊第二偏度系数(中位数偏度)

3×()

这些系数不提供偏度类型信息。

峰度(Kurtosis)

峰度和偏度一样,也是一种统计描述。峰度描述了概率分布的形状。对于此度量,较高的峰度对应较大偏差或者异常值的极端性。

g2=1ni=1n(xμσ)43

g2=m4m223=1ni=1n(xμ)4[1ni=1n(xμ)2]23

标准无偏估计:

G2=n1(n2)(n3)[(n+1)g2+6]

在非正态化分布中常带有偏见。

def skewness(data):
    """
    :param data: 数据
    :return: 偏度
    """
    m3 = np.sum(((data - np.mean(data)) / np.std(data)) ** 3) / (data.shape[0])
    m2 = np.sum(((data - np.mean(data)) / np.std(data)) ** 2) / (data.shape[0])

    g = m3 / np.power(m2, 3 / 2)

    skew = np.sqrt(data.shape[0] * (data.shape[0] - 1)) / (data.shape[0] - 2) * g
    return skew


def kurtosis(data):
    """
    :param data: 数据
    :return: 峰度
    """
    m4 = np.sum(((data - np.mean(data)) / np.std(data)) ** 4) / (data.shape[0])
    m2 = np.sum(((data - np.mean(data)) / np.std(data)) ** 2) / (data.shape[0])

    g2 = np.sum(((data - np.mean(data)) / np.std(data)) ** 4) / (data.shape[0]) - 3

    kurt = (data.shape[0] - 1) / ((data.shape[0] - 2) * (data.shape[0] - 3)) * ((data.shape[0] + 1) * g2 + 6)
    return kurt
posted @   编码雪人  阅读(1149)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端
点击右上角即可分享
微信分享提示