深度学习的一般认识
1、人脸识别的认识
链接:https://www.zhihu.com/question/26434245/answer/242126185
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
支持向量机是在高维空间找一个最优分隔平面来进行分类的一种方法。人脸图像一般维度很高,至少上万,如果你用支持向量机,通过核函数继续投影到更高维空间,非常耗时,性能也很差。
神经网络的话,直接用来人脸识别也是不现实的。常用的方法有神经网络的升级版本:深度学习(deep learning)。百度也成立了深度学习的研究院。深度学习的人脸识别,效果非常好,成为了现今研究的热门。
还有就是几何特征识别方法,这些方法都是十几年前的方法了,现在许多简单的方法都比基于规则的几何特征方法来的容易地多,也方便地多。这是一种快被淘汰的方法。
接着,说说我的理解:
人脸识别也是机器学习,人工智能的一个领域。我们把人脸图像的每个像素作为一个特征,便可以用机器学习的方法特征提取与分类。
人脸识别遇到的主要问题是小样本问题。所谓的小样本问题就是人脸图像的维度太高了,一般的照片动则百万像素,而人脸图像的样本一般情况下,也就几十,上百张,相比于百万是很少的。根据经验风险结构风险(http://blog.csdn.net/ice110956/article/details/14002791),以及VC维的知识,对于一般的特征与分类方法都不适用。
于是,人脸识别的相比于其他机器学习不同,其主要研究是如何降维。
相应的方法有子空间方法。所谓的子空间方法,简单的说就是把人脸映射到一个低维的子空间上面,得到维度少的多的特征。简单的子空间方法有PCA(http://blog.csdn.net/ice110956/article/details/14250745),LDA等等。还有基于纹理的LBP(http://blog.csdn.net/ice110956/article/details/10241351),SIFT(http://blog.csdn.net/ice110956/article/details/9373239)等等方法。
最近几年,基于sparse编码以及deep learning的方法在人脸上的运用非常广泛,效果也非常高。
sparse也称为稀疏编码。它是模拟人眼视觉细胞的方法,用很少的样本线性组合为图像。
deep learing(http://blog.csdn.net/zouxy09/article/details/8775360)则是模拟人类的神经网络的方法来实现的。
这两种方法都是从生物学入手的方法,目前有比较广泛的前景。