R_Studio(学生成绩)数据相关性分析
对“Gary.csv”中的成绩数据进行统计量分析
用cor函数来计算相关性,method默认参数是用pearson;并且遇到缺失值,use默认参数everything,结果会是NA
相关性分析
当值r>1时,正相关,一个变量增加或减少时,另一个变量也相应增加或减少
当值r=1时,无相关,说明两个变量相互独立,有一个变量值无法预测另一个变量值
当值r<1时,负相关,一个变量增加或减少时,另一个变量也相应减少或增加
相关系数取值范围限于: -1 <= r <= +1
好严格的对称性
如果只想看大学体育和大学英语 相关性系数
小case!
setwd('D:\\data') #更改工作目录 list.files() #列出当前工作目录下的文件 dat=read.csv(file="Gary.csv",header=TRUE) cor(dat) plot(dat) #大学体育 大学英语 相关性系数 cor(dat[,1],dat[,2]) #绘图 plot(dat[,1],dat[,2])
可视化相关性分析 传送门
[1] 使用 symnum() 函数实现可视化
[2] 使用 corrplot() 函数实现可视化
[3] 使用 PerformanceAnalytics 包进行可视化
[4] heatmap 可视化
(如需转载学习,请标明出处)