随笔分类 - Deep Learning
摘要:在tensorflow1.8之后的版本中,tensorflow.contrib部分都有tensorrt的组件,该组件存在的意义在于,你可以读取pb文件,并调用tensorrt的方法进行subgraph压缩,其他不能压缩的subgraph依然被tensorflow所处理。这样的操作方式就不同于你生成一
阅读全文
摘要:本文来自《BEGAN: Boundary Equilibrium Generative Adversarial Networks》,时间线为2017年3月。是google的工作。 作者提出一个新的均衡执行方法,该方法与从Wasserstein距离导出的loss相结合,用于训练基于自动编码器的GAN。
阅读全文
摘要:本文来自《Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks》,时间线为2017年3月。本文算是GAN的一个很大的应用里程点,其可以用在风格迁移,目标形变,季节变换,相片增强等等。 1 引言
阅读全文
摘要:本文来自《Age Progression/Regression by Conditional Adversarial Autoencoder》,时间线为2017年2月。 该文很有意思,是如何通过当前图片生成你不同年龄时候的样子。 假设给你一张人脸(没有告诉你多少岁)和一堆网上爬取的人脸图像(包含不同
阅读全文
摘要:本文来自《Wasserstein GAN》,时间线为2017年1月,本文可以算得上是GAN发展的一个里程碑文献了,其解决了以往GAN训练困难,结果不稳定等问题。 1 引言 本文主要思考的是半监督学习。当我们说学习概率分布,典型的思维是学习一个概率密度。这通常是通过定义一个概率密度的参数化族$(P_{
阅读全文
摘要:本文来自《towards principled methods for training generative adversarial networks》,时间线为2017年1月,第一作者为WGAN的作者,Martin Arjovsky。 下面引用自令人拍案叫绝的Wasserstein GAN 要知
阅读全文
摘要:本文来自《Image-to-Image Translation with Conditional Adversarial Networks》,是Phillip Isola与朱俊彦等人的作品,时间线为2016年11月。 作者调研了条件对抗网络,将其作为一种通用的解决image-to-image变换方法
阅读全文
摘要:本文来自《Generative Visual Manipulation on the Natural Image Manifold》,是大神Jun-Yan Zhu在2016年9月的作品。 0 引言 视觉交流在现在的社会发展中一直处于技术不够强大的现状,比如你想要去商场买个衣服,你想要告知导购衣服的颜
阅读全文
摘要:本文来自《Adversarial Autoencoders》,时间线为2015年11月。是大神Goodfellow的作品。本文还有些部分未能理解完全,不过代码在AAE_LabelInfo,这里实现了文中2.3小节,当然实现上有点差别,其中one-hot并不是11个类别,只是10个类别。 本文提出“对
阅读全文
摘要:本文来自《deep multi-scale video prediction beyond mean square error》,时间线为2015年11月,LeCun等人的作品。 从一个视频序列中预测未来的图像帧涉及到构建一个内部表征,该表征能够对准确对图片帧演化(如图像内容和动态)进行建模。这就是
阅读全文
摘要:本文来自《MobiFace: A Lightweight Deep Learning Face Recognition on Mobile Devices》,时间线为2018年11月。是作者分别来自CMU和uark学校。 0 引言 随着DCNN的普及,在目标检测,目标分割等领域都有不小的进步,然而其
阅读全文
摘要:本文来自《MobileFaceNets: Efficient CNNs for Accurate Real-Time Face Verification on Mobile Devices》,时间线为2018年4月。是北京交通大学和握奇数据公司的作品。 人脸发展至今,效果相比传统方法有了很大的提升,
阅读全文
摘要:本文来自《ArcFace: Additive Angular Margin Loss for Deep Face Recognition》,时间线为2018年1月。是洞见的作品,一作目前在英国帝国理工大学读博。 CNN近些年在人脸识别上效果显著,为了增强softmax loss的辨识性特征学习能力,
阅读全文
摘要:本文来自《L2-constrained Softmax Loss for Discriminative Face Verification》,时间线为2017年6月。 近些年,人脸验证的性能因引入了深度卷积网络而提升很大。一个典型的人脸识别流程就是: 训练一个基于softmax loss的深度卷积网
阅读全文
摘要:本文来自《Large-Margin Softmax Loss for Convolutional Neural Networks》,时间线为2016年12月,是北大和CMU的作品。 0 引言 过去十几年,CNN被应用在各个领域。大家设计的结构,基本都包含卷积层和池化层,可以将局部特征转换成全局特征,
阅读全文
摘要:本文来自《A Discriminative Feature Learning Approach for Deep Face Recognition》,时间线为2016年。采用的loss是Center loss。 0 引言 通常使用CNN进行特征学习和标签预测的架构,都是将输入数据映射到深度特征(最后
阅读全文
摘要:本文来自《FaceNet: A Unified Embedding for Face Recognition and Clustering》。时间线为2015年6月。是谷歌的作品。 0 引言 虽然最近人脸识别领域取得了重大进展,但大规模有效地进行人脸验证和识别还是有着不小的挑战。Florian Sc
阅读全文
摘要:人脸识别,大致可以分为以下四个步骤: 人脸检测:从图片中准确定位到人脸,并以矩形框将其裁剪出来; 人脸矫正(对齐): 检测到的人脸,可能角度不是很正,需要使其对齐,比如旋转,缩放; 特征提取:对矫正后的人脸进行特征提取,现在做法通常都是基于一个CNN模型; 人脸比对:对两张人脸图像提取的特征向量进行
阅读全文
摘要:本文来自《DSFD: Dual Shot Face Detector》,时间线为2018年10月,是南理工Jian Li在腾讯优图实验室实习时候的作品。在WIDER FACE,FDDB上效果也超过了PyramidBox和SRN。 0 引言 最近在比赛上拿到最好成绩的人脸检测模型大致可以分成2类: 基
阅读全文
摘要:本文来自《PyramidBox: A Context-assisted Single Shot Face Detector》,是来自百度的作品,时间线为2018年8月。 0 引言 最近基于锚的检测框架都是为了检测无约束条件下难检测的人脸,比如WIDER FACE,SSH,$S^3FD$等等都提出了尺
阅读全文