ML学习二——单变量线性回归

2-1模型描述

我们要使用一个数据集，数据集包含俄勒冈州波特兰市的住房价格。在这里，我要根据不同房屋尺寸所售出的价格，画出我的数据集。比方说，如果你朋友的房子是1250平方尺大小，你要告诉他们这房子能卖多少钱。

你可以做的一件事就是构建一个模型，也许是条直线，从这个数据模型上来看，也许你可以告诉你的朋友，他能以大约220000(美元)左右的价格卖掉这个房子。这就是监督学习算法的一个例子。

我将在整个课程中用小写m的

以之前的房屋交易问题为例，假使我们回归问题的训练集（Training Set）如下表所示

我们将要用来描述这个回归问题的标记如下:

我们可以看到这里有我们的训练集里房屋价格我们把它给我们的学习算法，学习算法的工作，然后输出一个函数，通常表示为小写

在线性回归中我们有一个像这样的训练集，m

我们会引入一些术语我们现在要做的便是为我们的模型选择合适的参数（parameters）

我们的目标便是选择出可以使得建模误差的平方和能够最小的模型参数。

我们绘制一个等高线图，三个坐标分别为θ₀

则可以看出在三维空间中存在一个使得

代价函数也被称作平方误差函数，有时也被称为平方误差代价函数。我们之所以要求出误差的平方和，是因为误差平方代价函数，对于大多数问题，特别是回归问题，都是一个合理的选择。

2-3 代价函数的理解（一）

让我们通过一些例子来获取一些直观的感受，看看代价函数到底是在干什么。

接下来我们的例子为θ₀为0的时候的分析

2-4 代价函数的理解（二）

代价函数的样子，等高线图，则可以看出在三维空间中存在一个使得J(θ_0,θ1)

通过这些图形，我希望你能更好地理解这些代价函数 J

想象一下你正站立在山的这一点上，站立在你想象的公园这座红色山上，在梯度下降算法中，我们要做的就是旋转360度，看看我们的周围，并问自己要在某个方向上，用小碎步尽快下山。每走一步就要思考一下，直到你接近局部最低点的位置

批量梯度下降（batch gradient descent）算法的公式为

其中α

在梯度下降算法中，这是正确实现同时更新的方法。

2-6 梯度下降的知识点总结

对 θ

现在，这条线有一个正斜率，也就是说它有正导数，因此，我得到的新的 θ₁

让我们来看看如果 α

如果 α

如果 α

在梯度下降法中，当我们接近局部最低点时，梯度下降法会自动采取更小的幅度，这是因为当我们接近局部最低点时，很显然在局部最低时导数等于零，所以当我们接近局部最低时，导数值会自动变得越来越小，所以梯度下降将自动采取较小的幅度，这就是梯度下降的做法。

2-7 线性回归的梯度下降

梯度下降算法和线性回归算法比较如图：

对我们之前的线性回归问题运用梯度下降法，关键在于求出代价函数的导数，即：

我们刚刚使用的算法，有时也称为批量梯度下降。指的是在梯度下降的每一步中，我们都用到了所有的训练样本 m，在梯度下降中，在计算微分求导项时，我们需要进行求和运算，所以，在每一个单独的梯度下降中，我们最终都要计算这样一个东西，这个项需要对所有 m

posted @ 2020-04-12 18:04 咻咻咻变小富婆阅读(216) 评论(1) 收藏举报

刷新页面返回顶部