小提琴图解读 - 统计学

小提琴图现在比较流行,在文章里很常见。

image

【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。


实例解析

数据分析实战之【小提琴图】

在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。

数据化分析解读:

1.通常汽缸数量少的汽车每加仑汽油可以行驶更多里程数;

2.4缸汽车的油耗分布比较分散,6缸汽车的油耗分布相对集中,8缸汽车的油耗分布很不均匀(中间大两头小);

3.4缸和8缸汽车的油耗都存在比较明显的离散值(上侧的须或下侧的须较长)。

如何绘制【小提琴图】?

#在R软件中安装vioplot包

install.packages("vioplot")

#载入vioplot包

library("vioplot")

#定义需要绘制的变量数据

x1 <- mtcars$mpg[mtcars$cyl==4]

x2 <- mtcars$mpg[mtcars$cyl==6]

x3 <- mtcars$mpg[mtcars$cyl==8]

#绘制小提琴图

vioplot(x1,x2,x3,names=c("4缸", "6缸", "8缸"), col="gold")

title("小提琴图:不同缸数对应每加仑汽油行驶里程数分布")

参考书目:《R语言实战》

 

参考:数据分析实战之【小提琴图】

posted @ 2017-07-11 17:28  Life·Intelligence  阅读(16620)  评论(0编辑  收藏  举报
TOP