R语言——基本绘图函数

通过一个综合的例子测试绘图函数

学习的内容是tigerfish老师的教程。

 

第一节:基本知识

 

用seq函数产生100位学生的学号。

> num = seq(201321001,201321100)
> num
  [1] 201321001 201321002 201321003 201321004 201321005 201321006 201321007 201321008
  [9] 201321009 201321010 201321011 201321012 201321013 201321014 201321015 201321016
 [17] 201321017 201321018 201321019 201321020 201321021 201321022 201321023 201321024
 [25] 201321025 201321026 201321027 201321028 201321029 201321030 201321031 201321032
 [33] 201321033 201321034 201321035 201321036 201321037 201321038 201321039 201321040
 [41] 201321041 201321042 201321043 201321044 201321045 201321046 201321047 201321048
 [49] 201321049 201321050 201321051 201321052 201321053 201321054 201321055 201321056
 [57] 201321057 201321058 201321059 201321060 201321061 201321062 201321063 201321064
 [65] 201321065 201321066 201321067 201321068 201321069 201321070 201321071 201321072
 [73] 201321073 201321074 201321075 201321076 201321077 201321078 201321079 201321080
 [81] 201321081 201321082 201321083 201321084 201321085 201321086 201321087 201321088
 [89] 201321089 201321090 201321091 201321092 201321093 201321094 201321095 201321096
 [97] 201321097 201321098 201321099 201321100

 

 

runif函数产生100个随机数(随机数是小数),代表课程1的成绩,100个数字,最小值50,最大值100。

该结果是均匀分布,用round函数对其取整。

 > x1 = round(runif(100,min=50,max=100));
 > x1
 [1] 85 68 69 92 76 67 90 82 98 68 98 68 80 74 75 90 78 52 55 75 91 63 99 89 93 85 65
 [28] 79 55 89 98 83 56 73 75 56 90 70 82 68 62 90 78 83 81 95 63 98 79 89 59 56 60 69
 [55] 68 93 85 65 64 68 73 97 86 88 93 71 65 71 82 70 63 76 60 97 92 78 99 54 50 79 74
 [82] 85 58 92 80 64 50 64 95 83 91 73 87 79 85 85 67 51 70 93

 

rnorm函数产生正态分布数字,代表课程2的成绩,平均值是80,标准差是7。再用round函数对其取整。

> x2 = round(rnorm(100,mean=80,sd=7))
> x2
  [1] 86 76 85 86 82 67 81 77 80 72 80 81 85 81 82 76 89 89 80 73 78 65 88 81 86 82 79
 [28] 75 76 81 89 79 82 78 81 91 93 82 72 70 86 77 83 77 74 82 85 84 77 68 89 72 75 71
 [55] 76 74 75 87 81 79 81 76 72 84 76 83 91 72 75 81 87 81 83 73 80 81 76 89 85 93 73
 [82] 80 88 81 87 95 87 88 81 81 78 75 81 79 78 87 75 76 86 86

 

 用rnorm函数产生正态分布数字,代表课程3的成绩,平均值是90,标准差是14。再用round函数对其取整。

> x3 = round(rnorm(100,mean=90,sd=14))
> x3
  [1]  45  89  87  78  88  87 104  72  82 103  73  77 113  80  51  79  94  80  99  75
 [21]  86  92  71  57  78  61  99  90  81  84 100 100  88  73  98  80 106  89  74  56
 [41]  75  93  97 103  64  87 120  94  79 102 100  88  77  75  87 100  73 104  64  99
 [61]  93  94  70  77 102  99 112 104  92 105  76  96  78 101  75  82  91 113 101 114
 [81]  69  84 102  92  92  79 103  97  97 113  74 107  81 102  76 103  87  83  70  77

 

从上面可以看到一些数字大于100,为了使得每个数字都小于等于100,使用which方法对x3进行修改,将超过100的修改为100。

> x3[which(x3>100)]=100
> x3
  [1]  45  89  87  78  88  87 100  72  82 100  73  77 100  80  51  79  94  80  99  75
 [21]  86  92  71  57  78  61  99  90  81  84 100 100  88  73  98  80 100  89  74  56
 [41]  75  93  97 100  64  87 100  94  79 100 100  88  77  75  87 100  73 100  64  99
 [61]  93  94  70  77 100  99 100 100  92 100  76  96  78 100  75  82  91 100 100 100
 [81]  69  84 100  92  92  79 100  97  97 100  74 100  81 100  76 100  87  83  70  77

 

 

将上面4个向量放到组合为数据框data.frame

> x = data.frame(num,x1,x2,x3)
> x
          num x1 x2  x3
1   201321001 85 86  45
2   201321002 68 76  89
3   201321003 69 85  87
4   201321004 92 86  78
5   201321005 76 82  88
6   201321006 67 67  87
7   201321007 90 81 100
8   201321008 82 77  72
9   201321009 98 80  82
10  201321010 68 72 100
11  201321011 98 80  73
12  201321012 68 81  77
13  201321013 80 85 100
14  201321014 74 81  80
15  201321015 75 82  51
16  201321016 90 76  79
17  201321017 78 89  94
18  201321018 52 89  80
19  201321019 55 80  99
20  201321020 75 73  75
21  201321021 91 78  86
22  201321022 63 65  92
23  201321023 99 88  71
24  201321024 89 81  57
25  201321025 93 86  78
26  201321026 85 82  61
27  201321027 65 79  99
28  201321028 79 75  90
29  201321029 55 76  81
30  201321030 89 81  84
31  201321031 98 89 100
32  201321032 83 79 100
33  201321033 56 82  88
34  201321034 73 78  73
35  201321035 75 81  98
36  201321036 56 91  80
37  201321037 90 93 100
38  201321038 70 82  89
39  201321039 82 72  74
40  201321040 68 70  56
41  201321041 62 86  75
42  201321042 90 77  93
43  201321043 78 83  97
44  201321044 83 77 100
45  201321045 81 74  64
46  201321046 95 82  87
47  201321047 63 85 100
48  201321048 98 84  94
49  201321049 79 77  79
50  201321050 89 68 100
51  201321051 59 89 100
52  201321052 56 72  88
53  201321053 60 75  77
54  201321054 69 71  75
55  201321055 68 76  87
56  201321056 93 74 100
57  201321057 85 75  73
58  201321058 65 87 100
59  201321059 64 81  64
60  201321060 68 79  99
61  201321061 73 81  93
62  201321062 97 76  94
63  201321063 86 72  70
64  201321064 88 84  77
65  201321065 93 76 100
66  201321066 71 83  99
67  201321067 65 91 100
68  201321068 71 72 100
69  201321069 82 75  92
70  201321070 70 81 100
71  201321071 63 87  76
72  201321072 76 81  96
73  201321073 60 83  78
74  201321074 97 73 100
75  201321075 92 80  75
76  201321076 78 81  82
77  201321077 99 76  91
78  201321078 54 89 100
79  201321079 50 85 100
80  201321080 79 93 100
81  201321081 74 73  69
82  201321082 85 80  84
83  201321083 58 88 100
84  201321084 92 81  92
85  201321085 80 87  92
86  201321086 64 95  79
87  201321087 50 87 100
88  201321088 64 88  97
89  201321089 95 81  97
90  201321090 83 81 100
91  201321091 91 78  74
92  201321092 73 75 100
93  201321093 87 81  81
94  201321094 79 79 100
95  201321095 85 78  76
96  201321096 85 87 100
97  201321097 67 75  87
98  201321098 51 76  83
99  201321099 70 86  70
100 201321100 93 86  77

 

计算每门课的平均分

> colMeans(x[2:4])
   x1    x2    x3 
76.74 80.49 86.26 
> colMeans(x)[c('x1','x2','x3')]
   x1    x2    x3 
76.74 80.49 86.26 

 

 使用apply函数也可以实现,参数2表示对列进行计算

> apply(x,2,mean)
         num           x1           x2           x3 
201321050.50        76.74        80.49        86.26 

 

 计算最大值,最小值。

> apply(x,2,min)
      num        x1        x2        x3 
201321001        50        65        45 
> apply(x,2,max)
      num        x1        x2        x3 
201321100        99        95       100 

 

计算总分

> apply(x[c('x1','x2','x3')],1,sum)
  [1] 216 233 241 256 246 221 271 231 260 240 251 226 265 235 208 245 261 221 234 223
 [21] 255 220 258 227 257 228 243 244 212 254 287 262 226 224 254 227 283 241 228 194
 [41] 223 260 258 260 219 264 248 276 235 257 248 216 212 215 231 267 233 252 209 246
 [61] 247 267 228 249 269 253 256 243 249 251 226 253 221 270 247 241 266 243 235 272
 [81] 216 249 246 265 259 238 237 249 273 264 243 248 249 258 239 272 229 210 226 256

 

计算总分最高的人的序号。

> which.max(apply(x[c('x1','x2','x3')],1,sum))
[1] 31

 

计算最高分的学号。

> x$num[which.max(apply(x[c('x1','x2','x3')],1,sum))]
[1] 201321031

 

 

第二节:绘图基本函数

 

绘制直方图函数hist

对课程1绘制直方图,横坐标表示分数区间,纵坐标表示频次。

> hist(x$x1)

对课程1和课程2绘制散点图,plot函数。通过该图可以大致看出两门课是否存在相关关系。

> plot(x$x1,x$x2)

列联函数table,对每个数据进行统计。

柱状图绘制函数barplot对统计结果进行绘制。barplot必须和table函数结合使用才有意义。

> table(x$x2)

65 67 68 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 91 93 95 
 1  1  1  1  1  5  3  2  6  8  4  4  4  5 15  6  3  2  4  6  5  3  5  2  2  1 
> barplot(table(x$x2))

饼图函数pie。pie也需要和table函数结合使用。

> pie(table(x$x2))

箱线图boxplot,对三门课程画箱线图。

> boxplot(x$x1,x$x2,x$x3)

指定箱线图的颜色

> boxplot(x[2:4],col=c('red','green','blue'))

使用horizontal=T将箱线图水平放置

> boxplot(x[2:4],col=c('red','green','blue'),horizontal=T)

 

对每个人画雷达图。雷达图可以给出比较直观的感觉。

> stars(x[2:4])

对雷达图进行颜色和样式的修改。使用draw.segments=T画扇形。

> stars(x[2:4],draw.segments=T)

 

茎叶图

> stem(x$x1)

  The decimal point is 1 digit(s) to the right of the |

  5 | 00124
  5 | 5566689
  6 | 002333444
  6 | 5557788888899
  7 | 0001133344
  7 | 555668889999
  8 | 001222333
  8 | 555555678999
  9 | 0000112223333
  9 | 5577888899

 

 散点图的参数设置

plot(x$x1,x$x2,
     main='课程1与课程2的关系', #设置标题
     xlab='课程1',#设置横坐标名称,如果不写则默认为该变量的名称
     ylab='课程2',#设置纵坐标名称
     xlim=c(0,100),#设置横坐标的范围
     ylim=c(0,100),#设置纵坐标的范围
     xaxs='r',#xaxs='r', yaxs='i':分别设定 x 和y 轴的形式。 "i"(内部)与 "r"(预设值) 形式的刻度都会依照资料的范围而自动调整,但是 "r" 形式的刻度会在刻度范围两边留一些空隙。 
     yaxs='r',
     col='red',#设置点的颜色
     pch=20 #设置画图的样式,20表示为圆点
     )

 

 

关于点的样式,上面显示用的是编号为20的样式,那么R其实提供了很多样式供使用,如下图。参考R语言绘图符号

用plot画各种形式的图

plot默认情况下画点,但是还有很多不同的形式,用type来控制。下面是不同的画法代表不同的意思。

type 图形样式类型,有九种可能的取值,分别代表不同的样式:参考

  • 'p'  画点;
  • 'l'   画线;
a=c(2,3,5,6,9);
b=c(3,5,7,5,7);
plot(a,b,type='b',col='red')

 

      

  • 'b'  同时画点和线,但点线不相交;
> plot(a,b,type='b',col='red')

 

  • 'c'  将type = 'b'中的点去掉,只剩下相应的线条部分;

 

> plot(a,b,type='c',col='red')

 

 

 

     

  • 'o'  同时画点和线,且相互重叠,这是它与type = 'b'的区别;
> plot(a,b,type='o',col='red',pch=20)

 

  • 'h'  画铅垂线;
> plot(a,b,type='h',col='red')

 

  • 's'  画阶梯线,从一点到下一点时,先画水平线,再画垂直线;
plot(a,b,type='s',col='red')

 

  • 'S'  也是画阶梯线,但从一点到下一点是先画垂直线,再画水平线;
> plot(a,b,type='S',col='red')

 

  • 'n'  作一幅空图,没有任何内容,但坐标轴、标题等其它元素都照样显示(除非用别的设置特意隐藏了)。
> plot(a,b,type='n',col='red')

 

 在一个图上画多个线

 

 构建一个数据框

> a
  a1 a2 a3
1 78 32 12
2 45 23 23
3 23 45 43
4 88 54 22
5 98 32 30

 

 画图,lines函数只能在别的图形上面画图,即必须以别的图作为基础,不能自己单独画图。

plot(a$a1,#先画a1
     type='l',#画曲线
     ylim=c(0,100),#设置纵坐标范围
     main='画多个曲线',#设置图表标题
     lwd=2, #设置线宽度为2,默认为1
     col='red'#设置颜色
     )

#在上图的基础上进一步画图
lines(a$a2,type='l',col='blue',lwd=2)#画a2的曲线图
lines(a$a3,type='l',col='green',lwd=2)#画a2的曲线图

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

posted @ 2014-06-23 00:35  todoit  阅读(10792)  评论(0编辑  收藏  举报