数据分析与挖掘 - R语言:多元线性回归
2016-05-25 16:47 猎手家园 阅读(895) 评论(0) 编辑 收藏 举报一个简单的例子!
环境:CentOS6.5
Hadoop集群、Hive、R、RHive,具体安装及调试方法见博客内文档。
线性回归主要用来做预测模型。
1、准备数据集:
X Y
0.10 42.0
0.11 43.5
0.12 45.0
0.13 45.5
0.14 45.0
0.15 47.5
0.16 49.0
0.17 53.0
0.18 50.0
0.20 55.0
0.21 55.0
0.23 60.0
> s=read.table("test-1.txt", header = F)
2、确定线性回归函数:Y = β0 + β1X + ε
其中β0 + β1X 表示Y随X的变化而线性变化的部分;ε是随机误差,是一切不确定因素的总和,其值不可测。
3、使用R语言中的lm()函数求解
> x=s$V1 > y=s$V2 > lm.sol<-lm(y ~ 1+x) > summary(lm.sol)
指标1:Pr(>|t|) 表示P– 值,即概率值。***说明极为显著, **说明高度显著, *说明显著, .说明不太显著,没有记号为不显著。
指标2:R-Squared: 0.9481 的值越大越好,至少应该在0.8以上。
4、绘制图形
> plot(x,y)
> abline(lm.sol)
5、作出预测
> z=data.frame(x=0.24)
> predict(lm.sol, z)
预测结果为:
1 59.89318
欢迎关注我的公众号:云栖语,不一样的研发视界。
![](https://images.cnblogs.com/cnblogs_com/hunttown/823638/o_yunqiyu.jpg)
云栖语微信公众号:change-1978
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步