[吴恩达机器学习笔记]12支持向量机4核函数和标记点kernels and landmark
12.支持向量机
觉得有用的话,欢迎一起讨论相互学习~
12.4 核函数与标记点- Kernels and landmarks
问题引入
- 如果你有以下的训练集,然后想去拟合其能够分开正负样本的非线性判别边界。
- 一种办法是构造一个复杂多项式特征的集合:
- 然而类似于等人为定义的特征是不是最好的呢?我们能不能通过函数来进行学习得到更复杂拟合度更高的特征来解决非线性问题呢?此时我们可以借助于待定系数法,把不同的特征看做是待定的未知的目标进行确定 , 使用表示待定的目标特征。
- 即新的表达式为:
特征构建
- 假设此处需要构建3个新特征。
- 首先在坐标上选取三个 地标(landmark)
- 然后给定一个样本x, 定义特征为样本x和地标的相似度
- 同样的 定义特征为样本x和地标的相似度
- 类似的 定义特征为样本x和地标的相似度
- 首先在坐标上选取三个 地标(landmark)
- 此处的 相似度函数 即 就是所说的 核函数 ,而核函数有很多种,即有很多种不同的定义相似度的方法,此处的核函数被称为 高斯核函数(Gaussian Kernel)
核函数和相似度
- 公式的展开项如下图所示,从图中可以看出
- 当x和landmark十分接近时,特征值为约等于1
- 当x和landmark距离很远时,特征值为约等于0
高斯核函数(Gaussian Kernel)
- 假设 地标1 的坐标为(3,5),使用3D图中,即时水平面上对应的坐标为(3,5),核函数使用高斯核,其中
- 等高线表示函数下降的速度 ,以下显示不同 对高斯函数陡峭程度的影响,很明显看出 时下降更快,而 时下降速度减缓:
特征点及边界确定过程
- 规定当时输出1
- 假设已经得到参数为
- 当给定的训练样本为图中 粉色点 时,此时由于x距离l1较近,所以根据高斯核模型,f1约等于1;而x距离l2,l3都较远,所以f2,f3约等于0
- 此时,将上述参数带入,则的值约等于0.5大于0,因此这个点预测的y值为1
- 当给定的训练样本为图中 蓝绿色点 时,此时由于x距离l1,l2,l3都较远,根据高斯核模型,f1,f2,f3都约等于0,此时,将上述参数带入,则的值约等于-0.5,因此这个点预测的y值为0
- 当你对 大量 的训练样本都进行这样的处理,最终会发现一条由大量点组成的 边界 ,显示 距离各个地标何种距离下 输出预测y会为1,否则y会为0.
- Note 在预测时,采用的不是训练实例本身的特征,而是通过核函数计算出的新特征
标签:
机器学习
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
2017-09-06 Tensorflow ActiveFunction激活函数解析