R_Studio(学生成绩)对数值型数据进行统计量分析
对“Gary.csv”中的成绩数据进行统计量分析
基础数据分析
均值 中位数 极差 标准差 变异系数 1/4分位数 3/4分位数 四分位间距... ...分析
setwd('D:\\data') #更改工作目录 list.files() #列出当前工作目录下的文件 dat=read.csv(file="Gary.csv",header=TRUE) #读取"Gary.csv文件" dats=dat[,3] #对大学体育成绩进行分析 # 统计量分析 #平均分 mean_ = mean(dats,na.rm=T) # 中位数 median_ = median(dats,na.rm=T) # 极差 range_ = max(dats,na.rm=T)-min(dats,na.rm=T) # 标准差 std_ = sqrt(var(dats,na.rm=T)) # 变异系数 variation_ = std_/mean_ # 四分位数间距 q1 = quantile(dats,0.25,na.rm=T) q3 = quantile(dats,0.75,na.rm=T) distance = q3-q1 a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T) colnames(a)=c("均值","中位数","极差","标准差","变异系数","1/4分位数","3/4分位数","四分位间距") print(a)
平均值mean(x, trim = 0, na.rm = FALSE, ...) 传送门
x - 是输入向量。
trim - 用于从排序的向量的两端删除一些观测值。
na.rm - 用于从输入向量中删除缺少的值。
中位数median(x, na.rm = FALSE)
x - 是输入向量。
na.rm - 用于从输入向量中删除缺少的值。
线性回归 传送门
多元回归
逻辑回归
正态分布 传送门
二项分布 传送门
泊松回归 传送门
协方差分析
时间序列分析
非线性最小二乘法
决策树 传送门
随机森林
生存分析卡方检验
(如需转载学习,请标明出处)