感知机应该是机器学习里面最简单的模型了。读一遍文章也能理解作者想表达的意思。因为以前像梯度下降,多项式拟合,神经网络都在Andrew Ng的公开课上看过了。但是真正关于书中的公式却不怎么理解。一些简单的作者也没有推导。毕竟这是机器学习,不是微积分,或者线性代数,或者概率论。微积分,概率论,线性代数是 大学期间的基础课程。很多人应该都学过。
关于感知机的几何模型。
感知机有如下几何解释:线性方程:
w•x+b=0
对应于特征空间Rn中的一个超平面S,其中w是超平面的法向量,b是超平面的截距。
我们首先看一下法向量的定义

感知机学习策略
既然了解了感知机的几何模型,接下来我们就看一下感知机的学习策略。
对于一个线性可分的 数据集
我们现在需要找到一个分离超平面,也就是确定w,b的参数,来将损失函数最小化,在这儿也就是求出所有的点到该几何平面的总距离,并使该总距离最短。从而将特征向量完全区分开来。
我们需要求任意一点到该超平面的距离,公式如下
我们首先来看|w•x0+b|的意义
我们先不管作者给出的公式。我们先看一下在线性代数里面是怎样求一个点到平面的距离的。
具体的公式推导请到网易公开课,线性代数课程观看,点击此处
从线性几何我们得出任意一点到平面的距离公式是
其中Ax+By+Cz-D,也就是我们上面给的线性几何模型。相对于感知机也就是w•x+b
对于A2+B2+C2开平方也就是将对法向量w(A,B,C) 的一系列操作。作者在书中提到该值是法向量w的L2范数。我们先看一下范数的概念。
该定义来自线性代数
从上定义我们可以得知||w||即为对A2+B2+C2开平方。
至此我们就明了了作者书中公式的由来。
关于感知机模型的学习策略请看机器学习-李航-统计学习方法学习笔记之感知机(2)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?