统计学作业4 概念

什么时候使用箱线图?
一个数值变量的时候,使用直方图或茎叶图。
当需要统计不同类别(多个)的数值变量时需要使用箱线图,也就是数值变量较多时需要使用。可以对不同类别的数值变量进行横向比较。
箱线图中的一些概念。
什么是中位数:中位数就是所有枪环数的平均值/平均成绩。
什么是四份位数:有两个4分位数,一个是25%,一个是75%,就是进行从高到低的排序,排在3/4,1/4,我们称之为4分位数。
四分位差或四分位距,是75%-25%所得到的区间,作为箱线图的箱体。
离群点:在上下内围栏之外的数值。
内围栏:分为上下两个内围栏,内围栏就是就是4分位差的1.5倍。
上内围栏:就是75%四分位向上1.5倍四分位差。
下内围栏:就是25%四分位向下1.5倍四分位差。
离群点:是大于上内围栏或者小于下内围栏的数值,也称外部点。用圈来表示。
相邻值:分为上相邻值和下相邻值。
上相邻值:就是这组数据在上内围栏中的最大值。
下相邻值:就是这组数据在下内围栏中的最小值。
外围栏:分为上下两个外围栏。
上外围栏:就是75%四分位向上3倍四分位差的距离。
Q75%+3*IQR(inner-quartile range)
下外围栏:就是25%四分位向下3倍四分位差的距离。
极值:在上下外围栏之外的数据称为极值。
箱线图的作用是什么?
箱线图的作用是通过箱线的形状看出数据的分布特征。

posted @ 2017-10-30 16:30  BlackcatJia  阅读(503)  评论(0编辑  收藏  举报