[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机
觉得有用的话,欢迎一起讨论相互学习~
参考资料 斯坦福大学 2014 机器学习教程中文笔记 by 黄海广
12.3 大间距分类背后的数学原理- Mathematics Behind Large Margin classification
向量内积
- 假设有两个向量,向量,其中向量的内积表示为.假设表示为u在坐标轴横轴上的投影,而表示为u在坐标轴纵轴上的投影,则向量u的欧几里得长度可表示为 , 且有
- 对于向量的内积 ,可以视为 v向量在u向量上的投影p乘以u向量的长度,这两者都为实数,且当v向量的投影与u向量同方向时,p取正号,否则p取负号 即有式子
向量内积研究SVM目标函数
- 为了更容易分析问题只保留了损失函数的后半部分而去掉了C及其乘积项。 ,原始损失函数如下图:
- 为简化起见,忽略掉截距,设置损失函数中参数为0,设置特征数n=2. ,则简化后的式子可写为:
- 因此可以认为SVM的目的就是最小化向量 范数的平方或者说是长度的平方
的意义
- 给定参数向量 θ 给定一个样本x, 计算其二者的乘积,这其中的含义是什么? 对于其相当于向量内积
- 首先,对于训练样本,其在x轴上的取值为,其在y轴上的取值为 ,此时 将其视为始于原点,终点位于训练样本的向量
- 然后将参数 也视为向量且其在横轴上的投影为 ,其在纵轴上的投影为
- 使用之前的方法,将训练样本投影到参数向量 θ,使用 来表示第 i 个训练样本在参数向量上的投影。 即有 $$\theta{T}x=p_{(i)}\parallel \theta\ \parallel=\theta_1x_1{(i)}+\theta_2x_2$$
- 代表从原点出发连接到第i个样本点的向量,是可正可负的,分别表示正样本和负样本;表示样本向量到参数向量上的投影,其也是可正可负的,同方向为正负方向为负 ,对于SVM中的约束也可以被 这个约束所代替
从到大间距
- 首先为方便起见设置 ,且只选取两个特征,即 ,则参数 可以表示成一条过原点的直线,且 决策界 与直线垂直。
- 反证法 如下图所示(1),y轴右边的表示正样本,而y轴左边的表示负样本,蓝线表示参数,绿线表示决策界 ,很明显这条决策界很不好,因为其与正负样本的间距太小了。 通过将样本投影到上可以得到p,此时正负样本的||p||都很小,根据SVM的公式||p|| * ||||>=1,则其必须使||||很大才能满足条件,这和目标函数希望找到一个小的参数的目的是矛盾的,这表明这并不是一条好的决策界
- 而图(2)中x在的投影p就相对的大一些,这样在满足公式需要的||||就会小一些,这和SVM的优化目标是一致的。所以 好的SVM的优化结果中,决策界的间距一定比较大
标签:
机器学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
2017-09-06 Tensorflow ActiveFunction激活函数解析