机器学习第四章复习

第四章

4.1 线性判据基本概念

  • 生成模型
  • 优势:

    • 可以根据p(x)采样新的样本数据
    • 可以检测出较低概率的数据,实现离群点检测
  • 劣势:纬度灾难问题

  • 判别模型

  • 优势:快速直接、省去耗时的高维观测似然概率估计

  • 线性判据

数学表达

  • 思考

    1. 线性模型的确定?

      先确定了维数,决策边界的方向,然后用所给的样本确定具体的模型;

    2. 判别模型的确定要考虑哪些因素?

      确定是线性和非线性。

      在误差允许范围内,也可以采用线性模型处理非线性可分问题

    3. 原点与超平面的位置关系有哪几种?

      三种,点在超平面上:W0=0;在超平面正侧:W0大于0;负侧:W0小于0;

4.2 线性判据学习概述

  • 参数空间&解域

  • 找到最优解

    设计目标函数及求解

4.3 并行感知机算法

  • 预处理

关于预处理的几何解释:

  • 在几何上,通过在特征空间上增加一个维度,使得决策边界可以通过原点(ω0项)

  • 翻转C2类样本:使得所有样本位于决策边界的同一侧

  • 目标函数

  • 求解方法—梯度下降法
  • 算法流程

    1. 初始化参数:a0,步长η,阈值τ
    2. 迭代更新:基于当前梯度更新参数a,更新集合Yk
    3. 停止迭代:所有训练样本的输出值都大于0,或者更新值小于阈值τ

4.4 串行感知机算法

  • 目标函数

目标函数的求解:梯度下降法

  • 算法流程
  • 收敛性

    如果训练样本是线性可分的,感知机(并行和串行)算法理论上收敛于一个解

    步长与收敛性的关系

4.5 Fisher线性判据

  • 出发点:把所有的样本都投影到一维空间,使得在投影线上最易于分类 。

  • 目标函数

  • 参数求解










4.6 支持向量机基本概念

  • 设计思想:给定一组训练样本,使得两个类中与决策边界最近的训练样本到决策边界的间隔最大

  • 如何计算间隔

  • 目标函数

持续更新中…

posted @ 2020-05-06 22:02  生于戊寅之年癸亥之月  阅读(155)  评论(0编辑  收藏  举报