R语言 线性回归一 入门
1. 数据准备
读取表格数据文件。使用read.table函数,结果会返回一个数据框:
> dfrm <- read.table("filename")
数据文件中包含标题栏,函数会在生成数据框时自动为数据列添加列名:
> dfrm <- read.table("test.txt", header=TRUE)
2. 线性回归
简单线性回归是最基本的模型。它只有两个变量,用一个含有误差项的线性关系来建模:
yi = a + bxi + c
多元线性回归有多个变量在关系式的右侧:
yi = a + bui + cvi + dwi + e
3. 简单线性回归
有两个向量x和y,他们包含成对观察值:(x1, y1), (x2, y2), ... , (xn, yn)。
函数lm运行一个线性回归并显示它的系数:
> lm(y ~ x)
Call:
lm(formula = y ~ x)
Coefficients:
(Intercept) x
17.72 3.25
函数lm估计回归系数a和b,并把它们分别作为截距(Intercept)和x的系数显示出来。
则回归方程是: yi = 17.72 + 3.25xi + c