Learning Face Age Progression: A Pyramid Architecture of GANs
前言
作为IP模式识别的CNN初始模型是作为单纯判别式-模式识别存在的,并以此为基本模型扩展到各个方向。基本功能为图像判别模型,此后基于Loc+CNN的检测模型-分离式、end2end、以及MaskCNN模型,而后出现基于CNN的预测模型-AcGans。
CNN作为一个基本判别式模型简化为数学模型依然为一个函数映射f(x)->y; 基于CNN的检测模型数学模型为 L(x)+f(x)->y,其中L(x)依然为判别式,给出loc信息,二维的为(y1,y2)点对; 基于CNN的Mask给出每个Pixel的类别信息,数学模型可以简化为 k(x).f(x)—k(x).y,其中K(x)为一个与点位置线性相关的函数;
到了AcGans, 例如基于年龄的预测,CNN为其组成部分之一,而生成式为主要目的服务,数学模型可以简化为g( f0(f2)*f2(x) )—y,把一个判别式f(x)分离为维持不变性的 f0(x)和用于分离的 f2(x),其中f0(x)满足生成式约束不变性, f2(x)满足特征提取-数据输入不变性约束,以满足使用数据完成训练生成模型所要求,以及处理输入的特征提取模型。
通过训练的模型,数据流为f2(x)*X—>f2(X),通过特征提取函数,生成纹理特征; f0*f2(X)—>f0(f2(X)
...........................................
简介
参考:CVPR2018值得一看的25篇论文....
intro 和 related works 主要讲了现有方案大多将年龄信息优先而 identity 信息次之,换句话说,就是生成不同年龄的同时,identity 信息不能很好保留。
Generator 部分不做介绍,无亮点,本文亮点在 loss 部分和特征提取器的跨级并联结构上。
文中提出了特征提取器用于提出特定特征,原因是作者认为相同年龄段的不同人脸有着相同的的纹理等特定信息,而这个提取器就是提取出这些特征。此外,该分类器是经过 age 分类任务预训练好了的。
文中和今年很多思路一样,考虑到了 low-level 和 high-level 信息,将第 2、4、7 等层信息 concat 起来,作为 d 的输入。
identity 信息的保留和上一个 extractor 类似,在人脸分类数据集上预训练,然后拿来直接当 extractor。
独立训练最优G和D,然后得到G学习到一个年龄变换,D作为一个可靠的分类函子。