SAE模型

Stacked Autoencoder（SAE）模型是一个由多层稀疏自编码器组成的深度神经网络模型，其前一层自编码器的输出作为其后一层自编码器的输入，最后一层是个分类器（logistic分类器或者softmax分类器）

（一）sparse autoencoder算法

1.概念：sparse autoencoder是一种非监督学习算法，需要满足以下两种约束：

（1）autoencoder：输入等于输出

（2）sparse：隐层的每个神经元的响应是稀疏的，也就是大部分时间响应为0，也就是平均响应尽可能小（其中m为训练样本个数）

2.代价函数

其中：

（1）第一项为autoencoder的约束项；

（2）第二项为惩罚项目，防止过拟合；

（3）第三项为稀疏的约束，是一个KL散度的衡量标准：

3.最优化方案：该约束函数是一个非凸函数，采用批量梯度下降算法

其中：

至于梯度可以用backpropagation（BP）算法来求解；

（二）logistic回归模型与softmax回归mox

1.logistic回归模型

（1）适用于二分类；

（2）模型函数：

（3）代价函数（最大似然）：

（4）最优化方案：梯度下降算法；

2.softmax回归模型

（1）适用于多分类；

（2）模型函数：

（3）代价函数：

（4）最优化方案：梯度下降算法； 3.softmax回归分类器适用于k个互斥的类别的分类；k个logistic回归分类器适用k个并不完全互斥的类别的分类；

（三）SAE模型

（1）预训练：利用无标签数据对每一层的参数用sparse autoencoder训练初始化；

（2）微调：利用有标签数据对整个深度神经网络进行微调；

posted @ 2015-11-26 10:13 我花开后百花残阅读(2511) 评论(0) 收藏举报

刷新页面返回顶部

我花开后百花残