小提琴图解读 - 统计学
小提琴图现在比较流行,在文章里很常见。
【小提琴图】其实是【箱线图】与【核密度图】的结合,【箱线图】展示了分位数的位置,【小提琴图】则展示了任意位置的密度,通过【小提琴图】可以知道哪些位置的密度较高。
实例解析
在上图中,白点是中位数,黑色盒型的范围是下四分位点到上四分位点,细黑线表示须。外部形状即为核密度估计(在概率论中用来估计未知的密度函数,属于非参数检验方法之一)。
数据化分析解读:
1.通常汽缸数量少的汽车每加仑汽油可以行驶更多里程数;
2.4缸汽车的油耗分布比较分散,6缸汽车的油耗分布相对集中,8缸汽车的油耗分布很不均匀(中间大两头小);
3.4缸和8缸汽车的油耗都存在比较明显的离散值(上侧的须或下侧的须较长)。
如何绘制【小提琴图】?
#在R软件中安装vioplot包
install.packages("vioplot")
#载入vioplot包
library("vioplot")
#定义需要绘制的变量数据
x1 <- mtcars$mpg[mtcars$cyl==4]
x2 <- mtcars$mpg[mtcars$cyl==6]
x3 <- mtcars$mpg[mtcars$cyl==8]
#绘制小提琴图
vioplot(x1,x2,x3,names=c("4缸", "6缸", "8缸"), col="gold")
title("小提琴图:不同缸数对应每加仑汽油行驶里程数分布")
参考书目:《R语言实战》