机器学习2

合集 - 机器学习(3)

1.机器学习12024-08-22

2.机器学习22024-08-29

3.机器学习32024-09-13

逻辑回归

Logistic回归是一种广义的线性回归分析模型。它是一种分类方法，可以适用于二分类问题，也可以适用于多分类问题，但是二分类的更为常用，也更加容易解释。实际中最为常用的就是二分类的logistic回归，常用于数据挖掘，疾病自动诊断，经济预测等领域。

基本思想

a. 寻找合适的假设函数，即分类函数，用以预测输入数据的判断结果；
b. 构造代价函数，即损失函数，用以表示预测的输出结果与训练数据的实际类别之间的偏差；
c. 最小化代价函数，从而获取最优的模型参数。

注意：Logistic回归算法是一种分类算法，它适用于标签取值离散的情况，它的输出值永远在0到1之间。
不推荐将线性回归用于分类问题，线性回归模型的预测值可超越[0,1]范围。

逻辑回归模型的假设

其中X

决策边界

分类：线性决策边界非线性决策边界

下图为线性决策边界的例子，红色代表正类, 蓝色代表负类。

其中参数 θ 为向量[-3,1,1] ,则当 -3 + x₁ +x₂ ≥ 0，即 x₁ +x₂ ≥ 3时，模型将预测y =1.我们可以绘制直线 x₁ +x₂ = 3，这条线便是我们模型的决策边界，它能将预测为1的区域和预测为0的区域分隔开。

下图为非线性决策边界的例子，用曲线才能分隔

参数θ为向量[-1 0 0 1 1]，当 -1 + x₁²+x₂² ≥ 0,即x₁²+x₂² ≥ 1时，模型将预测 y = 1. 我们可以绘制圆心在原点且半径为1的圆形 1²+x₂² = 1 .

代价函数

我们的代价函数有许多局部最小值，这将影响梯度下降算法寻找全局最小值

定义Logistic回归的代价函数为：

结论：

梯度下降

算法的原理与线性回归类似，只不过由于预测函数和代价函数都不一样：

注意：线性回归和逻辑回归的函数不同：

过拟合

可以发现上图高次的模型实际上已经出现了过拟合的现象

术语：欠拟合underfit<=>高偏差high bias、过拟合overfit<=>高方差high variance

解决方法：

解决过拟合的方法有三种，分别是增加数据集的样本数量、选取和预测结果最相关的特征作为子集训练而不是训练整个数据集、正则化。

增加样本数量：局限性比较大，毕竟实际情况中样本的数量不可能想有多少就有多少
特征选择：这么做是为了选择与结果最为相关的特征进行训练，但是可能每一个特征都与预测结果直接相关，选择一个子集就会丢掉一些有用的特征
正则化：如果说特征选择是直接消灭掉不太相关的特征，那么正则化做的就不那么绝对，它会削弱这些不太相关特征的影响，算是一种弱化版的“特征选择”

posted on 2024-08-29 22:22 gjwqz 阅读(26) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 机器学习1

· 机器学习3

· 机器学习----逻辑回归

· NLP学习笔记-逻辑回归

· 统计学习——逻辑回归

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App

导航

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

公告

昵称： gjwqz
园龄： 1年5个月
粉丝： 0
关注： 0

统计

随笔 - 40
文章 - 0
评论 - 0
阅读 - 1831

合集

随笔档案

阅读排行榜