ggplot2绘图入门系列之二:图层控制与直方图

前文所述,ggplot2使用图层将各种图形元素逐步添加组合,从而形成最终结果。第一层必须是原始数据层,其中data参数控制数据来源,注意数据形式只能是数据框格式。aes参数控制了对哪些变量进行图形映射,以及映射方式,aes是Aesthetic的缩写。

下面我们来绘制一个直方图作为示例。数据集仍采取mpg,对hwy变量绘制直方图。首先加载了扩展包,然后用ggplot函数建立了第一层,hwy数据映射到X轴上;使用+号增加了第二层,即直方图对象层。此时p被视为一种层对象,使用summary函数可得到关于它的更多信息,print(p)命令即可进行绘图。

 1 library(ggplot2)
 2 p <- ggplot(data = mpg,aes(x = hwy))
 3 p <- p + geom_histogram()
 4 summary(p)
 5 data: manufacturer, model, displ, year, cyl, trans,
 6   drv, cty, hwy, fl, class [234x11]
 7 mapping:  x = hwy
 8 faceting: facet_grid(. ~ ., FALSE)
 9 -----------------------------------
10 geom_histogram:
11 stat_bin:
12 position_stack: (width = NULL, height = NULL)

 

上面的信息告诉我们,p对象含有两层,第一层数据层描述了变量和映射方式,第二层是直方图对象(geom_histogram),geom表示几何对象,它是ggplot中重要的图层控制对象,因为它负责图形渲染的类型。geom_histogram是图形渲染类型的一种,其它类型可参见官网

每个geom对象都需要有数据输入,数据可以从第一层中自动读取,也可以在aes参数中直接设置。而且每个geom还默认搭配某种统计变换(stat),geom_histogram的默认统计变换是stat_bin。它负责对数据进行分组计数。

下面我们尝试两种更为复杂的直方图,首先将数据按照year这个变量划分为两组,用不同的颜色绘制直方图,而且用频率而非计数来刻画Y轴,并添加密度曲线。

p <- ggplot(mpg,aes(hwy))
p + geom_histogram(position = 'identity',
    alpha=0.5,
    aes(y = ..density..,
    fill = factor(year))) +
    stat_density(geom = 'line',
    position = 'identity',
    aes(colour = factor(year)))

 

如果想将两个直方图分开绘制,也可以使用facet_grid参数,结果如下图所示。

 

                                                                                                                                                                                                                                                       转载于:http://r-ke.info/2012/02/06/ggplot2-intro-2.html

posted @ 2014-07-25 19:53  polyAI  阅读(9705)  评论(0编辑  收藏  举报