R in action读书笔记(22)第十六章 高级图形进阶(下)

16.2.4 图形参数

在lattice图形中,lattice函数默认的图形参数包含在一个很大的列表对象中,你可通过trellis.par.get()函数来获取,并用trellis.par.set()函数来修改。show.settings()函数可展示当前的图形参数设置情况。查看当前的默认设置,并将它们存储到一个mysettings列表中:

> show.settings()
> mysettings<-trellis.par.get()

查看叠加点的默认设置值:

> mysettings$superpose.symbol

$alpha

[1] 1 1 1 1 1 1 1

$cex

[1] 0.8 0.8 0.8 0.8 0.8 0.8 0.8

$col

[1] "#0080ff" "#ff00ff" "darkgreen" "#ff0000" "orange" "#00ff00" "brown"

$fill

[1] "#CCFFFF" "#FFCCFF""#CCFFCC" "#FFE5CC" "#CCE6FF" "#FFFFCC""#FFCCCC"

$font

[1] 1 1 1 1 1 1 1

$pch

[1] 1 2 3 4 5 6 7 8 9 10

可以看到分组变量的每个水平都使用空心圆圈(pch = 1)。定义了7个水平后,图形符号

将会被循环使用。最后,我们再做如下声明:

> mysettings$superpose.symbol$pch<-c(1:10)
> trellis.par.set(mysettings)
> show.settings()

此时lattice图形将对分组变量的第一个水平使用符号1(空心圆圈),第二个使用符号2(空心三角形),以此类推。另外,我们对分组变量的10个水平的符号都进行了定义,而不是7个。这种图形设置效果将会一直存在,直到关闭图形设备。你可以按照此方式对其他任意图形参数进行修改。

16.2.5 页面摆放

lattice函数不识别par()设置,先将lattice图形存储到对象中,然后利用plot()函数中的split =或position =选项来进行控制。split选项将页面分割为一个指定行数和列数的矩阵,然后将图形放置到该矩阵中。split选项的格式为:

split=c(placement row,placement column,total number of rows,total number of columns)

例:

 

> library(lattice)
> graph1<-histogram(~height|voice.part,data=singer,
+                   main="Heights of choral singers by voice part")
> graph2<-densityplot(~height,data=singer,group=voice.part,
+                     plot.points=FALSE,auto.key=list(columns=4))
> plot(graph1,split=c(1,1,1,2))
> plot(graph2,split=c(1,2,1,2),newpage=FALSE)

 

它将把第一幅图放置到第二幅图的上面。具体来讲,第一个plot()函数把页面分割成一列

两行的矩阵,并将图形放置到第一列、第一行中(自上往下、从左至右地计数)。第二个plot()

函数做同样的分割,但是把图形放置到第一列、第二行中。因为plot()函数默认启动一个新的页面,所以你需要禁止该操作,因此设定选项newpage = FALSE

使用position =选项可以对大小和摆放方式进行更多的控制:

> plot(graph1,position=c(0,.3,1,1))
> plot(graph2,position=c(0,0,1,.3),newpage=FALSE)

position = c(xmin, ymin, xmax, ymax),该页面的x-y坐标系统是矩形,x轴和y轴的维度范围都是从0到1,原点(0, 0)在图形左下角。在lattice图形中你还可以改变面板的顺序。高级绘图函数的index.cond =选项可以设定条件变量水平的顺序。以voice.part因子为例:

> levels(singer$voice.part)
[1] "Bass 2"    "Bass 1"    "Tenor 2"   "Tenor 1"   "Alto 2"    "Alto 1"    "Soprano 2"
[8] "Soprano 1"

16.3 ggplot2

ggplot2包提供了一个基于全面而连贯的语法的绘图系统。它弥补了R中创建图形缺乏一致

性的缺点,使得用户可以创建有创新性的、新颖的图形类型。ggplot2中最简单的绘图方式是利用qplot()函数,即快速绘图函数。格式为:

qplot(x, y = NULL, ..., data, facets =NULL, margins = FALSE,

geom = "auto", stat = list(NULL), position = list(NULL), xlim= c(NA,NA), ylim = c(NA, NA), log = "", main = NULL,xlab =deparse(substitute(x)), ylab = deparse(substitute(y)), asp = NA)

选项:描 述

alpha :元素重叠的alpha透明度,数值为0(完全透明)到1(完全不透明)间的分数

color、shape、size、fill :把变量的水平与符号颜色、形状或大小联系起来。对于直线图,colo将把线条颜色与变量水平联系起来,对于密度图和箱线图,fill将把填充颜色与变量联系起来。图例将会被自动绘制

data :指定一个数据框

facets :指定条件变量,创建一个栅栏图。表达式如rowvar~ colvar。为创建一个基于单条件变量的栅栏图,可用rowvar ~ .或. ~ colvar

geom :设定定义图形类型的几何形状。geom选项是一个单条目或多条目的字符型向量,

包括"point" 、"smooth" 、"boxplot" 、"line" 、"histogram"、"density"、"bar"和"jitter"

main、sub :字符向量,设定标题和副标题

method、formula :若geom ="smooth",则会默认添加一条平滑拟合曲线和置信区间。当观测数大于1000时,便需要调用更高效的平滑拟合算法。方法包括回归lm、广义可加模型gam、稳健回归rlm。formula参数指定拟合的形式例如,要添加简单的回归曲线,则设定geom = "smooth", method = "lm",formula = y ~ x。将表达式改为y ~poly(x, 2)将生成二次拟合。注意表达式使用的是字母x和y,而不是变量的名称对于method = "gam",一定要记得加载mgcv包。对于method ="rml",则需加载MASS包

x、y :指定摆放在水平轴和竖直轴的变量。对于单变量图形(如直方图),则省略y

xlab、ylab :字符向量,设定横轴和纵轴标签

xlim、ylim :二元素数值型向量,分别指定横轴和纵轴的最小值和最大值

library(ggplot2)

mtcars$cylinder<-as.factor(mtcars$cyl)

qplot(cylinder,mpg,data=mtcars,geom=c("boxplot","jitter"),

fill=cylinder,

main="Box plots with superimposed data points",

xlab="Number of cylinders",

yalb="Miles per gallon")

型添加回归线和置信区间带

传动类型定义了行分面,而气缸数则定义了列分面。数据点的大小代表了汽车马力

的评分:

library(ggplot2)

mtcars$cyl<-factor(mtcars$cyl,levels=c(4,6,8),

labels=c("4cylinders","6 cylinders","8 cylinders"))

mtcars$am<-factor(mtcars$am,levels=c(0,1),

labels=c("Automatic","manual"))

qplot(wt,mpg,data=mtcars,facets=am~cyl,size=hp)

library(ggplot2)

data(singer,package="lattice")

qplot(height,data=singer,geom=c("density"),

facets=voice.part~.,fill=voice.part)

16.4 交互式图形

16.4.1 与图形交互:鉴别点

可对散点图中的点进行鉴别和标注的函数:identify()。利用该函数,你可用鼠标对散点图中所选择的点标注行数或者行名称,直到你选择了Stop或者右击图形识别工作才会停止。

plot(mtcars$wt,mtcatrs$mpg)

identify(mtcars#wt,mtcars$mpg,labels=row.names(mtcars))

光标将从一个点变成一个十字。单击散点图上的点,可以对它们进行标注,直到你从Graphics Device(图形设备)菜单中选择了Stop,或者右击了图形并从右键菜单中选择了Stop。

16.4.2 playwith

playwith包提供了一个GTK+图形用户界面(GUI),使得用户可以编辑R图形并与其交互。

playwith()函数允许用户识别和标注点、查看一个观测所有的变量值、缩放和旋转图形、

添加标注(文本、箭头、线条、矩形、标题和标签)、修改视觉元素(颜色、文本大小等)、应用先前存储的图形风格,以及以多种格式输出图形结果。

library(playwith)

library(lattice)

playwith(

xyplot(mpg~wt|factor(cyl)*factor(am),

data=mtcars,subscripts=TRUE,

type=c("r","p"))

)

playwith窗口。依赖于GTK+ GUI,用户可以使用鼠标编辑图形

与identify()函数不同,playwith()既对R基础图形有效,也对lattice和ggplot2

图形有效。Theme(主题)菜单上的一些选项仅与基础图形契合的很好,一些则与ggplot2图形契合的较好(如标注),还有些对ggplot2图形无效(如识别点)。

16.4.3 latticist

使用latticist包,可通过栅栏图方式探索数据集。该包不仅提供了图形用户界面,也可以通过vcd包来创建新的图形。如果有需要,latticist还能与playwith整合到一起,例:

library(latticist)

mtcars$cyl<-factor(mtcars$cyl)

mtcars$gear<-factor(mtcars$gear)

latticist(mtcars,use.playwith=TRUE)

拥有latticist函数功能的playwith窗口。用户可创建lattice并与vcd图形交互

16.4.4 iplots包的交互图形

playwith和latticist包只能与单幅图形交互,而iplots包提供的交互方式则有所不同。该包提供了交互式马赛克图、柱状图、箱线图、平行坐标图、散点图和直方图,以及颜色刷,并可将它们结合在一起绘制。这意味着你可通过鼠标对观测点进行选择和识别,并且对其中一幅图形的观测点突出显示时,其他被打开的图形将会自动突出显示相同的观测点。另外,还可通过鼠标来收集图形对象(诸如点、条、线)和箱线图的信息。

函数 描 述

ibar() 交互式柱状图

ibox() 交互式箱线图

ihist() 交互式直方图

imap() 交互式地图

imosaic() 交互式马赛克图

ipcp() 交互式平行坐标图

iplot() 交互式散点图

例:

library(iplots)

attach(mtcars)

cylinders<-factor(cyl)

gears<-factor(gear)

transmission<-factor(am)

ihist(mpg)

ibar(gears)

iplot(mpg,wt)

ibox(mtcars[c("mpg","wt","qsec","disp","hp")])

ipcp(mtcars[c("mpg","wt","qsec","disp","hp")])

imosaic(transmission,cylinders)

detach(mtcars)

现在尝试以下步骤。

 单击柱状图(gears)窗口的三号齿轮条,直条将会变红色。另外,其他图形窗口中的所

有三齿轮发动机都会被突出显示。

 鼠标下移,并在散点图(wt对mpg)窗口选择一个含有点的矩形区域。这些点将会被突出显示,而其他图形窗口中相应的观测点也将会变成红色。

 按住Ctrl键不动,将鼠标移动到某幅图形中点、条、箱线图或线上,该对象的详细信息将会在一个弹出窗口中显示出来。

 右击任何对象,便可在右键菜单中获得一些选项。例如,你可以右击箱线图(mpg)窗口,将图形转变为一个平行坐标图(PCP)。

 拖动鼠标可选择不止一个对象(点、条等),或使用Shift键通过单击选择不邻接的对象。

你可尝试在柱状图(gears)窗口选择三号和五号齿轮条。

16.4.5 rggobi

GGobi有许多吸引眼球的优点,包括:交互式散点图、柱状图、平行坐标图、时间序列图、散点图矩阵和三维旋转的综合使用;窗口刷和点识别;多变量变换方法;复杂的探索平台,如导向动画的和手动的1维及2维图形。令人振奋的是,rggobi软件包为GGobi和R提供了一个无缝接口。

posted @ 2015-05-11 23:08  机器学习算法与Python  阅读(1708)  评论(0编辑  收藏  举报