机器学习笔记2

单变量线性回归 Linear regression with one variable

1.1 模型表示 Model Representation

1.1.1 线性回归

学习第一个监督学习的算法：线性回归，其中只有一个参数的线性回归算法称为：单变量线性回归

首先来看一个根据房屋大小预测价格的例子

线性回归中的数据表示：

下面符号定义分别为：
m：代表训练集中实例的数量
x：代表特征/输入变量
y：代表目标变量/输出变量
(x,y)：代表训练集中的实例
(x(i),y(i))：代表第i个实例

1.1.2 单变量线性回归

线性回归模式表示：

h：代表学习算法的解决方案或函数也称为假设(hypothesis)

h根据输入的x值来得出y值，y值对应房子的价格。如果将y关于x的函数表示为：，那么就可以把这个问题叫成单变量线性回归问题

1.2 代价函数 Cost Function

代价函数可以理解为是优化目标函数

比如有m=47个样本，假设函数h为，我们需要做的就是优化假设函数h即选择适合的参数θ₀和 θ₁ ，使得误差最小

选取不同的参数 θ₀和 θ₁，产生的 h 不同，最终的直线也不同：

我们需要找到一个最合适的参数来接近真实值，也就是求目标函数的最优解。等价于求下面J函数的最小值

举个例子：

有数据点(1，1)，(2，2)，(3，3)，设θ₀=0，即函数h(x)过原点，左图中从上到下的三条直线分别是θ₁=1，0.5，0，右图为代价函数J(θ1)

在右图中，很明显当θ₁=1时，为代价函数J(θ₁)取得最小值，是我们优化的目标

当同时考虑θ₀和 θ₁时是代价函数J(θ₁)则转为三维图像

也可以将三维图像转为等高线图(轮廓图)，与h(x)一起观测优化过程

1.3 梯度下降 Gradient descent

1.3.1 梯度下降简介

梯度下降法是让代价函数J得到最优化

假设只有θ₀和 θ₁，不断的更新θ₀和 θ₁的值，直到最优解，当然也有可能是局部最优

可以想象成我们一开始在山顶，每次迈出一步都是最快下山的方向，不断的下降高度，直到到达最低点

1.3.2 梯度下降算法

梯度下降算法对 θ赋值，使得 J(θ)按梯度下降最快方向进行，一直迭代下去，最终得到局部最小值，即收敛 convergence

梯度下降算法不只用于线性回归，可以用来最小化任何代价函数 J。公式如下

求导的目的，基本上可以说取这个红点的切线，即这条红色直线。由于曲线右侧斜率为正，导数为正。因此，θ₁ 减去一个正数乘以 α，值变小。

曲线左侧斜率为负，导数为负。因此，θ1 减去一个负数乘以 α，值变大。θ1不断的向最低点靠近

α表示学习率，它决定了我们沿着能让代价函数下降程度最大的方向向下迈出的步子的大小

！注意：θ0，θ1必须同步更新，不然会出错

同时α大小的选择也是十分关键

如果 α 太小，只能小碎步下降，需要很多步才能到达全局最低点，效率太低了
如果 α 太大，那么算法可能会越过最低点。一次次越过最低点，离它越来越远。会导致无法收敛，甚至发散。

看一个例子：

先初始化θ1的值，然后用梯度下降法一步一步往下移，当越接近最低点时，导数就越小，那么幅度也越接近0，直到等于0时θ1的值将不会被改变

1.3.3 梯度下降法与线性回归算法

使用均方误差作为代价函数J，在梯度下降法和线性回归算法中作比较

在梯度下降法中，需要优化J(θ0,θ1),不断的改变θ0,θ1的值。直到J(θ0,θ1)收敛。J(θ0,θ1)的导数如下：

整理之后变成：

更新过程：

但是线性回归的“代价函数”总是这样一个弓形的样子（凸函数），凸函数是没有局部最优解，只有一个全局最优解。无论什么时候对这种代价函数使用线性回归，得到的结果总是收敛至全局最小，没有全局最优以外的局部最优

posted @ 2021-06-30 11:17 bird7 阅读(47) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区，博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】博客园社区专享云产品让利特惠，阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 为什么说在企业级应用开发中，后端往往是效率杀手？
· 用 C# 插值字符串处理器写一个 sscanf

阅读排行：
· 为DeepSeek添加本地知识库
· 精选4款基于.NET开源、功能强大的通讯调试工具
· DeepSeek智能编程
· [翻译] 为什么 Tracebit 用 C# 开发
· 腾讯ima接入deepseek-r1，借用别人脑子用用成真了~

公告

昵称： bird7
园龄： 4年9个月
粉丝： 1
关注： 3

<

2025年2月

>

日

一

二

三

四

五

六

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

1

2

3

4

5

6

7

8

随笔档案

阅读排行榜