R数据可视化初阶-散点图、散点图矩阵、相关系数
散点图plot
• plot(v,type,col,xlab,ylab)
• v:数值向量。
• type:采用值“p”仅绘制点,“l”仅绘制线和“o”绘制点和线。
• xlab:x轴的标签。
• ylab:y轴的标签。
• main:图表的标题。
• col:用于给点和线的颜色
在绘制第一行后,可以通过lines()函数使用一个额外的向量作为输入来绘制图表中的第二行
PS:只是用用,数据量太小,基本看不出来啥规律
> cardata mpg cyl disp hp drat wt qsec Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 Valiant 18.1 6 225 105 2.76 3.460 20.22 > plot(x=cardata$wt,y=cardata[,1],xlab='weight',ylab='milage',main='weight&milage')
还可以限定xlim、ylim
散点图绘制,各个变量之间的两两关系
>plot(x=cardata$wt,y=cardata[,1],xlab='weight',ylab='milage',main='weight&milage')
数据来源 > pairs(~wt+mpg+disp+cyl,data=cardata,main="Scatterplot Matrix")
所有变量
> pairs(~.,data=cardata,maintainer='Cardata')
~.指代所有
相关系数图:相关系数计算得到的相关系数矩阵
相关系数绘制成图,蓝色代表正相关,红色代表负相关性,颜色深度越深代表数值相关性越高,颜色越浅相关性越低,白色没有相关性。
应用:线性回归和逻辑回归中很有用,因为有的模型需要变量之间是独立的
> library(corrplot) > corrplot(cor(cardata))
#可以指定图的形状,斜三角、叠加方式等
追加相关系数
> corrplot(cor(cardata),addCoef.col = 'yellow')#追加黄色数值
> corrplot(cor(cardata),order="AOE",addCoef.col = 'grey')#排个序
> corrplot(cor(cardata),method = "square",type = "upper")#上三角方形
相关系数&图像
> corrplot(cor(cardata),order="AOE",type = "upper",tl.pos = "tp") > corrplot(cor(cardata), add = TRUE, type = "lower", method = "number", order = "AOE", col="black",tl.pos = "n",cl.pos = "n")
也可以根据聚类等进行呈现,可以看官方手册