R in action读书笔记(22)第十六章 高级图形进阶(下)
16.2.4 图形参数
在lattice图形中,lattice函数默认的图形参数包含在一个很大的列表对象中,你可通过trellis.par.get()函数来获取,并用trellis.par.set()函数来修改。show.settings()函数可展示当前的图形参数设置情况。查看当前的默认设置,并将它们存储到一个mysettings列表中:
> show.settings() > mysettings<-trellis.par.get()
查看叠加点的默认设置值:
> mysettings$superpose.symbol $alpha [1] 1 1 1 1 1 1 1 $cex [1] 0.8 0.8 0.8 0.8 0.8 0.8 0.8 $col [1] "#0080ff" "#ff00ff" "darkgreen" "#ff0000" "orange" "#00ff00" "brown" $fill [1] "#CCFFFF" "#FFCCFF""#CCFFCC" "#FFE5CC" "#CCE6FF" "#FFFFCC""#FFCCCC" $font [1] 1 1 1 1 1 1 1 $pch [1] 1 2 3 4 5 6 7 8 9 10
可以看到分组变量的每个水平都使用空心圆圈(pch = 1)。定义了7个水平后,图形符号
将会被循环使用。最后,我们再做如下声明:
> mysettings$superpose.symbol$pch<-c(1:10) > trellis.par.set(mysettings) > show.settings()
此时lattice图形将对分组变量的第一个水平使用符号1(空心圆圈),第二个使用符号2(空心三角形),以此类推。另外,我们对分组变量的10个水平的符号都进行了定义,而不是7个。这种图形设置效果将会一直存在,直到关闭图形设备。你可以按照此方式对其他任意图形参数进行修改。
16.2.5 页面摆放
lattice函数不识别par()设置,先将lattice图形存储到对象中,然后利用plot()函数中的split =或position =选项来进行控制。split选项将页面分割为一个指定行数和列数的矩阵,然后将图形放置到该矩阵中。split选项的格式为:
split=c(placement row,placement column,total number of rows,total number of columns)
例:
> library(lattice) > graph1<-histogram(~height|voice.part,data=singer, + main="Heights of choral singers by voice part") > graph2<-densityplot(~height,data=singer,group=voice.part, + plot.points=FALSE,auto.key=list(columns=4)) > plot(graph1,split=c(1,1,1,2)) > plot(graph2,split=c(1,2,1,2),newpage=FALSE)
它将把第一幅图放置到第二幅图的上面。具体来讲,第一个plot()函数把页面分割成一列
两行的矩阵,并将图形放置到第一列、第一行中(自上往下、从左至右地计数)。第二个plot()
函数做同样的分割,但是把图形放置到第一列、第二行中。因为plot()函数默认启动一个新的页面,所以你需要禁止该操作,因此设定选项newpage = FALSE
使用position =选项可以对大小和摆放方式进行更多的控制:
> plot(graph1,position=c(0,.3,1,1)) > plot(graph2,position=c(0,0,1,.3),newpage=FALSE)
position = c(xmin, ymin, xmax, ymax),该页面的x-y坐标系统是矩形,x轴和y轴的维度范围都是从0到1,原点(0, 0)在图形左下角。在lattice图形中你还可以改变面板的顺序。高级绘图函数的index.cond =选项可以设定条件变量水平的顺序。以voice.part因子为例:
> levels(singer$voice.part) [1] "Bass 2" "Bass 1" "Tenor 2" "Tenor 1" "Alto 2" "Alto 1" "Soprano 2" [8] "Soprano 1"
16.3 ggplot2 包
ggplot2包提供了一个基于全面而连贯的语法的绘图系统。它弥补了R中创建图形缺乏一致
性的缺点,使得用户可以创建有创新性的、新颖的图形类型。ggplot2中最简单的绘图方式是利用qplot()函数,即快速绘图函数。格式为:
qplot(x, y = NULL, ..., data, facets =NULL, margins = FALSE,
geom = "auto", stat = list(NULL), position = list(NULL), xlim= c(NA,NA), ylim = c(NA, NA), log = "", main = NULL,xlab =deparse(substitute(x)), ylab = deparse(substitute(y)), asp = NA)
选项:描 述
alpha :元素重叠的alpha透明度,数值为0(完全透明)到1(完全不透明)间的分数
color、shape、size、fill :把变量的水平与符号颜色、形状或大小联系起来。对于直线图,colo将把线条颜色与变量水平联系起来,对于密度图和箱线图,fill将把填充颜色与变量联系起来。图例将会被自动绘制
data :指定一个数据框
facets :指定条件变量,创建一个栅栏图。表达式如rowvar~ colvar。为创建一个基于单条件变量的栅栏图,可用rowvar ~ .或. ~ colvar
geom :设定定义图形类型的几何形状。geom选项是一个单条目或多条目的字符型向量,
包括"point" 、"smooth" 、"boxplot" 、"line" 、"histogram"、"density"、"bar"和"jitter"
main、sub :字符向量,设定标题和副标题
method、formula :若geom ="smooth",则会默认添加一条平滑拟合曲线和置信区间。当观测数大于1000时,便需要调用更高效的平滑拟合算法。方法包括回归lm、广义可加模型gam、稳健回归rlm。formula参数指定拟合的形式例如,要添加简单的回归曲线,则设定geom = "smooth", method = "lm",formula = y ~ x。将表达式改为y ~poly(x, 2)将生成二次拟合。注意表达式使用的是字母x和y,而不是变量的名称对于method = "gam",一定要记得加载mgcv包。对于method ="rml",则需加载MASS包
x、y :指定摆放在水平轴和竖直轴的变量。对于单变量图形(如直方图),则省略y
xlab、ylab :字符向量,设定横轴和纵轴标签
xlim、ylim :二元素数值型向量,分别指定横轴和纵轴的最小值和最大值
library(ggplot2) mtcars$cylinder<-as.factor(mtcars$cyl) qplot(cylinder,mpg,data=mtcars,geom=c("boxplot","jitter"), fill=cylinder, main="Box plots with superimposed data points", xlab="Number of cylinders", yalb="Miles per gallon")
型添加回归线和置信区间带
传动类型定义了行分面,而气缸数则定义了列分面。数据点的大小代表了汽车马力
的评分:
library(ggplot2) mtcars$cyl<-factor(mtcars$cyl,levels=c(4,6,8), labels=c("4cylinders","6 cylinders","8 cylinders")) mtcars$am<-factor(mtcars$am,levels=c(0,1), labels=c("Automatic","manual")) qplot(wt,mpg,data=mtcars,facets=am~cyl,size=hp)
library(ggplot2) data(singer,package="lattice") qplot(height,data=singer,geom=c("density"), facets=voice.part~.,fill=voice.part)
16.4 交互式图形
16.4.1 与图形交互:鉴别点
可对散点图中的点进行鉴别和标注的函数:identify()。利用该函数,你可用鼠标对散点图中所选择的点标注行数或者行名称,直到你选择了Stop或者右击图形识别工作才会停止。
plot(mtcars$wt,mtcatrs$mpg) identify(mtcars#wt,mtcars$mpg,labels=row.names(mtcars))
光标将从一个点变成一个十字。单击散点图上的点,可以对它们进行标注,直到你从Graphics Device(图形设备)菜单中选择了Stop,或者右击了图形并从右键菜单中选择了Stop。
16.4.2 playwith
playwith包提供了一个GTK+图形用户界面(GUI),使得用户可以编辑R图形并与其交互。
playwith()函数允许用户识别和标注点、查看一个观测所有的变量值、缩放和旋转图形、
添加标注(文本、箭头、线条、矩形、标题和标签)、修改视觉元素(颜色、文本大小等)、应用先前存储的图形风格,以及以多种格式输出图形结果。
library(playwith) library(lattice) playwith( xyplot(mpg~wt|factor(cyl)*factor(am), data=mtcars,subscripts=TRUE, type=c("r","p")) )
playwith窗口。依赖于GTK+ GUI,用户可以使用鼠标编辑图形
与identify()函数不同,playwith()既对R基础图形有效,也对lattice和ggplot2
图形有效。Theme(主题)菜单上的一些选项仅与基础图形契合的很好,一些则与ggplot2图形契合的较好(如标注),还有些对ggplot2图形无效(如识别点)。
16.4.3 latticist
使用latticist包,可通过栅栏图方式探索数据集。该包不仅提供了图形用户界面,也可以通过vcd包来创建新的图形。如果有需要,latticist还能与playwith整合到一起,例:
library(latticist) mtcars$cyl<-factor(mtcars$cyl) mtcars$gear<-factor(mtcars$gear) latticist(mtcars,use.playwith=TRUE)
拥有latticist函数功能的playwith窗口。用户可创建lattice并与vcd图形交互
16.4.4 iplots包的交互图形
playwith和latticist包只能与单幅图形交互,而iplots包提供的交互方式则有所不同。该包提供了交互式马赛克图、柱状图、箱线图、平行坐标图、散点图和直方图,以及颜色刷,并可将它们结合在一起绘制。这意味着你可通过鼠标对观测点进行选择和识别,并且对其中一幅图形的观测点突出显示时,其他被打开的图形将会自动突出显示相同的观测点。另外,还可通过鼠标来收集图形对象(诸如点、条、线)和箱线图的信息。
函数 描 述
ibar() 交互式柱状图
ibox() 交互式箱线图
ihist() 交互式直方图
imap() 交互式地图
imosaic() 交互式马赛克图
ipcp() 交互式平行坐标图
iplot() 交互式散点图
例:
library(iplots) attach(mtcars) cylinders<-factor(cyl) gears<-factor(gear) transmission<-factor(am) ihist(mpg) ibar(gears) iplot(mpg,wt) ibox(mtcars[c("mpg","wt","qsec","disp","hp")]) ipcp(mtcars[c("mpg","wt","qsec","disp","hp")]) imosaic(transmission,cylinders) detach(mtcars)
现在尝试以下步骤。
单击柱状图(gears)窗口的三号齿轮条,直条将会变红色。另外,其他图形窗口中的所
有三齿轮发动机都会被突出显示。
鼠标下移,并在散点图(wt对mpg)窗口选择一个含有点的矩形区域。这些点将会被突出显示,而其他图形窗口中相应的观测点也将会变成红色。
按住Ctrl键不动,将鼠标移动到某幅图形中点、条、箱线图或线上,该对象的详细信息将会在一个弹出窗口中显示出来。
右击任何对象,便可在右键菜单中获得一些选项。例如,你可以右击箱线图(mpg)窗口,将图形转变为一个平行坐标图(PCP)。
拖动鼠标可选择不止一个对象(点、条等),或使用Shift键通过单击选择不邻接的对象。
你可尝试在柱状图(gears)窗口选择三号和五号齿轮条。
16.4.5 rggobi
GGobi有许多吸引眼球的优点,包括:交互式散点图、柱状图、平行坐标图、时间序列图、散点图矩阵和三维旋转的综合使用;窗口刷和点识别;多变量变换方法;复杂的探索平台,如导向动画的和手动的1维及2维图形。令人振奋的是,rggobi软件包为GGobi和R提供了一个无缝接口。