机器学习第四章复习

第四章

第四章

4.1 线性判据基本概念

生成模型

优势：
- 可以根据p(x)采样新的样本数据
- 可以检测出较低概率的数据，实现离群点检测
劣势：纬度灾难问题
判别模型

优势：快速直接、省去耗时的高维观测似然概率估计
线性判据

数学表达

思考
1. 线性模型的确定？
  
  先确定了维数，决策边界的方向，然后用所给的样本确定具体的模型；
2. 判别模型的确定要考虑哪些因素？
  
  确定是线性和非线性。
  
  在误差允许范围内，也可以采用线性模型处理非线性可分问题
3. 原点与超平面的位置关系有哪几种？
  
  三种，点在超平面上：W0=0；在超平面正侧：W0大于0；负侧：W0小于0；

4.2 线性判据学习概述

参数空间&解域

找到最优解

设计目标函数及求解

4.3 并行感知机算法

预处理

关于预处理的几何解释：

在几何上，通过在特征空间上增加一个维度，使得决策边界可以通过原点(ω0项)
翻转C2类样本：使得所有样本位于决策边界的同一侧
目标函数

求解方法—梯度下降法

算法流程
1. 初始化参数：a0,步长η,阈值τ
2. 迭代更新：基于当前梯度更新参数a，更新集合Yk
3. 停止迭代：所有训练样本的输出值都大于0，或者更新值小于阈值τ

4.4 串行感知机算法

目标函数

目标函数的求解：梯度下降法

算法流程

收敛性

如果训练样本是线性可分的，感知机（并行和串行）算法理论上收敛于一个解

步长与收敛性的关系

4.5 Fisher线性判据

出发点：把所有的样本都投影到一维空间，使得在投影线上最易于分类。
目标函数

参数求解

4.6 支持向量机基本概念

设计思想：给定一组训练样本，使得两个类中与决策边界最近的训练样本到决策边界的间隔最大
如何计算间隔

目标函数

持续更新中…

posted @ 2020-05-06 22:02 生于戊寅之年癸亥之月阅读(161) 评论(0) 编辑收藏举报

刷新页面返回顶部