tingpan

生命不息,折腾不止!
  首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

DEX: Deep EXpectation of apparent age from a single image 论文阅读

Posted on 2018-10-04 00:55  tingpan  阅读(886)  评论(0编辑  收藏  举报

来自:IMDB-WIKI - 500k+ face images with age and gender labels  https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

该论文提出了Deep EXpectation(DEX)的表面年龄估计,该方法在2015年获得了ChaLearn LAP表面年龄估计的第一名。

作者提出了将年龄的回归问题转化为分类问题,这样可以用深度学习的cnn方法来训练,训练方法是用ImageNet训练好的VGG-16网络进行初始化,然后用IMDB-WIKI数据集进行finetune,最后再用LAP数据集再次进行finetune。

一、具体实现过程如下:

image

1、输入包含人物的图像;

2、对图片进行人脸检测,对于每张图片从-60°到+60°,以5°为步进进行旋转,另外也对图片旋转至-90°、90°、180°进行人脸检测;

3、将检测到的人脸区域上下左右向外扩展40%,将扩展后的区域裁切出来,最终图片尺寸压缩为256x256;

4、将所有裁切好的以及标注好的数据集放入VGG-16网络结构进行训练;

5、最终输出为101个类,即0~100岁,softmax输出,输出为每个年龄的概率,概率越大表示为这个年龄的可能性越大。

二、数据集

1、IMDB上获得461,871张,WIKI上获得62,359张,共524,230张,最后为了去除各年龄数据的不均衡,最终得到260,282张图片用于训练;

2、LAP数据集有4699张人脸图片,该数据集划分为三个部分,2476张用于训练,1136张用于验证,1087张用于测试。LAP数据集可http://chalearnlap.cvc.uab.es/dataset/18/description/下载。

三、评估方法

1、MAE(The standard mean absolute error):平均绝对误差;

2、ε-error:每张图片的检测错误率,定义如下:

image


end