君子博学而日参省乎己则知明而行无过矣

公告

感知机模型

感知机(perceptron)是二类分类的线性分类模型，其输入为实例的特征向量，输出为实例的类别，取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面，属于判别模型。感知机旨在求出将训练数据进行线性划分的分离超平面。为此，导入基于误分类的损失函数，利用梯度下降法对损失函数进行极小化，求得感知机模型。

感知机模型

定义1(感知机) 假设输入空间(特征空间)是

称为感知机。其中，

1此处的

感知机是一种线性分类模型，属于判别模型。感知机模型的假设空间是定义在特征空间中的所有 线性分类器模型(linear classification model)或线性分类器(linear classifier)，即函数集合

2因为是线性分类器，所以

感知机有如下几何解释:线性方程

对应于特征空间

感知机模型

感知机学习策略

数据集的线性可分

定义(数据集的线性可分性)给定一个数据集

其中，

能够将数据集的正实例点和负实例点完全正确地划分到超平面的两侧，即对所有

感知机学习策略

感知机的学习的目标是找到一个能够将训练正实例点和负实例点完全正确分离的超平面，即确定感知机模型参数

感知机所采用的损失函数是误分类点到超平面

3其实，关于损失函数最直接的想法是误分类点的总数，但是这样的损失函数不是参数

4

其次，对于误分类的数据

成立，因为对误分点来说，

这样假设超平面S的误分类点集合为

不考虑

5其实在这里我不太理解的是，为什么可以不考虑

给定训练数据集

其中，

其中，

显然，损失函数

感知机学习的策略是在假设空间中选取使损失函数(

感知机学习算法

感知机学习算法的原始形式

感知机学习算法是对以下最优化问题的算法，给定一个训练数据集

其中，

其中

感知机的学习算法是误分类驱动的，具体采用随机梯度下降法(stochastic gradient descent)。首先，任意选取一个超平面

假设误分类点集合

给出。

随机选取一个误分类点

式中

算法(感知机学习算法的原始形式)

输入:训练数据集

输出:

(1) 选取初值

(2) 在训练集中选取数据

(3) 如果

(4) 转至(2)，直至训练集中没有误分类点。

这种学习算法直观上有如下解释:当一个实例点被误分类，即位于分离超平面的错误的一侧时，则调整

算法的收敛性

现在要证明，对于线性可分数据集感知机学习算法原始形式收敛，即经过有限次迭代可以得到一个将训练数据集完全正确划分的分离超平面感知机模型。为了便于叙述，将偏置

定理(Novikoff):设训练数据集

(1) 存在满足条件

(2)令

证明 (1) 由于训练数据集是线性可分的，按照定义，存在超平面可将训练数据集完全分开，取此超平面为

6因为前提是能够将数据完全分开，所以

所以存在

使

(2)感知机算法从

则第k个误分类实例的条件是

若

即

接下来进行两个不等式的推导

(1)

由式(

由此递推即得不等式(

(2)

由式(

结合不等式(

于是

定理表明，误分类的次数

感知机学习算法的对偶形式

对偶形式的基本思想是，将

逐步修改

7误分类点

8

8公式(

算法(感知机学习算法的对偶形式)

输入:线性可分的数据集

输出:

(1)

(2)在训练集中选取数据

(3)如果

(4)转至(2)直到没有误分类数据

转载自：http://zhouyichu.com/machine-learning/Statical-Learning-Perceptron.html

posted on 2015-07-22 01:27 刺猬的温驯阅读(1845) 评论(0) 编辑收藏举报

刷新页面返回顶部