机器学习 - 线性回归(linear regression)

m = Numbers of training examples 训练样本的数量
x's = "input" variable/features 输入变量/输入特征
y's = "output" variable/"target" variable 输出变量/要预测的目标变量
(x,y) = a single training example 一个训练样本
(x(i),y(i)) = a specific training example 第i个训练样本

先来看看监督学习算法(supervised learning algorithm)是怎样工作的。
image
我们向学习算法提供训练集,比如房价训练集。学习算法的任务是输出一个函数,通常用h表示(hypothsis)。假设函数的作用是把房子的大小作为输入变量,比如把想出售的这栋房子的面积大小作为x的值,假设函数会试着输出相应房子的预测y值。

当我们设计一个学习算法的时候,下一步需要做的事情是决定怎么表示这个假设函数h。
我们使用h_θ(x)=θ_0+θ_1*x表示,缩写可为h_θ(x)或h(x)

这就是数据集函数的作用,表示我们要预测y是一个关于x的线性函数。这种线性的预测函数是学习的基础,被称为线性回归。本例子是一个一元线性回归,单变量x的函数能预测所有价格,这种模型也叫单变量线性回归。

我们从这个例子开始先拟合线性函数,然后我们将在此基础上,最终处理更复杂的模型、学习更复杂的学习算法。

posted @ 2022-03-12 15:11  MissOceanL  阅读(122)  评论(0编辑  收藏  举报