R vif() 以及 step()

library(package="car")
data <- read.csv("C:\\users\\mike1\\desktop\\data\\RData\\hald水泥数据.csv", header=T, sep=",",fileEncoding = "utf-8", stringsAsFactors = FALSE)
data1 <- data[2:dim(data)[2]]
data1

cor(data1)
scatterplotMatrix(data1, main="correlation")

result <- lm(y~., data=data1)
summary(result)

vif(result)  # we can directly use the function not like python class
step(result,direction="forward")
step(result,direction="backward")
step(result, direction="both")

myStep <- step(result, direction="both")
myStep1 <- step(result,direction="backward",trace=2)


summary(myStep)
summary(myStep1)



vif(myStep)

 

共线性,显示各变量之间有强相关,vif()函数在 car包中, 而step() 函数内置。

 

 

偏相关图

 

相关系数图:

 

逐步回归图

 

 

 

 

以上只截取了部分图,但是结果与书上的不一样。最后虽然使用的是逐步回归,但是有一个系数不显著,不知道为什么没把 x4.1这个变量去掉,只能手动选择x1, x2 作为变量。

 

posted @ 2020-06-30 23:58  看星星的派大星  阅读(2984)  评论(0编辑  收藏  举报