感知机
感知机是二类分类的线性分类模型,其输入是样本的特征向量,输出是样本的类别,取+1或-1。感知机对应于输入空间(特征空间)中将样本划为正负两类的分离超平面。
- 学习目标:求出将训练数据线性划分的分离超平面。
- 学习策略:导入基于误分类的损失函数(感知机学习方法是误分类驱动的)-->利用梯度下降法对损失函数极小化-->得到感知机模型参数w和 b
- 损失函数:
- 误分类点的总数,不是w和b的可导函数,不易优化;
- 误分类样本到超平面的总距离,采用!
- 对偶:
- 从感知机的对偶形式中可以看出,样本更新次数越多,说明它距离分离超平面越近,越难正确划分,对学习结果影响越大。
- 对偶形式中,训练样本仅以内积形式出现,可预先将训练集中样本的内积计算存储起来。
- 感知机是神经网络和支持向量机的基础
-->神经网络: 感知机学习算法对线性不可分问题不适用,不收敛,需要解决异或类的非线性问题
-->SVM:感知机学习算法得到很多解(不同初始超平面和随机选择不同误分类点),为了得到唯一超平面,可对分离超平面增加约束条件(几何间隔最大化)