怎样提高深度学习的效果？

怎么让深度学习模型获得更好的效果？这个是一直有人问我的问题，或者可以这么问？

我怎么提高正确率？或者为什么我的深度神经网络效果这么差？我经常这样回复“”我给不出确切的答案，但是我能给你一些建议“”

下面我将列一些我认为会对提升学习效果有效的一些建议。我将这些想法mark到下面，这些想法不仅仅对深度学习有用，而且对机器学习同样有效。

提升学习算法性能的四个建议

1 通过数据

2 通过算法

3 通过微调算法

4 采用集成ensembles方式，

一通过数据：

1）获取更多的数据

2）发明更多的数据

3）重新调整你的数据

4）变换你的数据

5）特征选择

获取更多的数据

模型的质量取决于你训练数据的质量。你需要最好的数据去解决你的问题，同时你也需要最多的数据。

深度学习和其他非线性技术的机器学习技术在数据越多时，效果越好。深度学习尤其是这样。

在图中可以看出，当数据量超过一定阶段，普通的机器学习算法到了精度极限了，但是深度学习不是。

发明更多的数据

深度学习算法在数据量大时效果会更好，但是当我们没办法获得大量的数据，我们可以发明更多的数据

一、如果你的数据是数字向量，依据已有的向量进行随机修改

二、如果你的数据是图片，依据已有的图像进行随机修改例如尺度缩放、旋转、平移

上述方法被称为数据增广

在caffe中的数据层，如下图所示，中间那个镜像和crop_size就对应图像的两种操作，是数据数据增广的方式

相关链接：

特征选择

分为：

过滤方式：过滤特征选择方法运用统计方法将一个分值分配给每个特征.这些特征按照分数排序,然后决定是被保留还是从数据集中删除.这个方法通常是单变量且独立的考虑每个特征,或者考虑其依赖变量.一些过滤方法包括Chi squared test(方卡检验),information gain(信息增益)和correlation coefficient scores(相关系数得分).

包装方式：包装方法考虑一族特征作为搜索问题,不同的组合被准备,检验并和其他组合比较. 我们使用一个预测模型评估特征的组合,然后根据模型精度给每个特征组合一个分数.

这个搜索过程可能有条不紊的例如best-fist搜索算法, 它可能随机例如random hill-climbing 算法.或者它可能是启发式的例如前向和后向传递增添和删除特征的.一个例子就是递归特征消除算法.

嵌入方式：嵌入式算法在模型创建的时候,学习哪些特征对于模型精度的贡献最大.最典型的嵌入式特征选择方法是正则化方法.正则化方法也被称为引入附加约束到预测算法(例如回归算法)的优化,它偏向于较低复杂度的模型.正则规划算法的例子是Lasso,Elastic Net和Ridge Regression.

二通过算法：

http://machinelearningmastery.com/improve-deep-learning-performance/

posted on 2016-09-22 21:20 mitutao 阅读(4153) 评论(0) 编辑收藏举报

刷新页面返回顶部

mitutao

怎样提高深度学习的效果？

导航

公告