随笔分类 -  Deep Learning

摘要:本文来自《Detecting Faces Using Region-based Fully Convolutional Networks》,又是腾讯ai实验室的作品。时间线为2017年9月。 0 引言 如图所示,影响人脸检测的涉及到人脸遮挡,人脸尺寸,光照条件,各种姿态,丰富的表情等等。fast/f 阅读全文
posted @ 2018-11-29 10:24 仙守 阅读(957) 评论(0) 推荐(0) 编辑
摘要:本文来自《$S^3$FD: Single Shot Scale-invariant Face Detector》,时间线为2017年11月. 0 引言 基于锚的目标检测方法,是通过分类和回归一系列预先设定的锚来检测目标的。这里预先设定的锚通常都是一个个基于不同尺度和长宽比的框。这些锚通常都是关联一层 阅读全文
posted @ 2018-11-28 13:15 仙守 阅读(613) 评论(0) 推荐(0) 编辑
摘要:该文来自《FaceBoxes: A CPU Real-time Face Detector with High Accuracy》。该文时间线是2018年1月 虽然人脸检测上随着深度学习的普及,引来了巨大的进步,可是如何在CPU环境下实时的保持高准确度是一个难题,因为高准确度的网络往往伴随着大量的计 阅读全文
posted @ 2018-11-26 17:29 仙守 阅读(1795) 评论(0) 推荐(0) 编辑
摘要:该文来自《SSH: Single Stage Headless Face Detector》,本文时间线2017年8月。 不同于face rcnn那种两阶段的方法,SSH和ssd一样是一阶段的方法。其从一个分类网络的前面卷积层直接检测人脸。这里所谓的Headless是移除潜在的分类网络的"头",而且 阅读全文
posted @ 2018-11-26 13:16 仙守 阅读(1611) 评论(0) 推荐(1) 编辑
摘要:face r-cnn是腾讯ai实验室的作品,而且登录过腾讯ai实验室官网,发现果然硕果累累,不得不佩服。 1 引言 人脸检测虽然相对之前有了不小的进步,可是还是因为真实世界中人脸图像的明显变化导致仍然极具挑战。 图1中的人脸就同时包含了遮挡,光照,尺度,姿态和表情。 而随着近来faster rcnn 阅读全文
posted @ 2018-11-22 10:48 仙守 阅读(1948) 评论(0) 推荐(0) 编辑
摘要:该模型hybrid-resolution model (HR),来自《finding tiny faces》,时间线为2016年12月 0 引言 虽然大家在目标识别上有了较好的进步,可是检测小物体仍然是一个极具挑战的事情。对于几乎所有当前的识别和目标检测系统而言,尺度不变性是一个必须的特性。但是从实 阅读全文
posted @ 2018-11-20 16:04 仙守 阅读(710) 评论(0) 推荐(0) 编辑
摘要:因为这两篇论文感觉内容较短,故而合并到一个博文中。 Multi-view face detection 本文来自《Multi-view Face Detection Using Deep Convolutional Neural Networks》的解读。时间线是2015年4月。 本文考虑的是多角度 阅读全文
posted @ 2018-11-19 09:28 仙守 阅读(1139) 评论(0) 推荐(0) 编辑
摘要:0 引言 本文是之前为了解决如何将文字贴到图片上而编写的代码,默认是如发票一类的,所以并未考虑透视变换等。且采用的是pygame粘贴方式,之前也尝试过opencv的seamlessClone粘贴。 值得注意的是,通过修改参数,增加各种干扰操作(羽化,噪音等等),生成的数据集看似丰富,其实因为内在的数 阅读全文
posted @ 2018-11-15 10:57 仙守 阅读(452) 评论(0) 推荐(0) 编辑
摘要:本文是基于《 A convolutional neural network cascade for face detection》的解读,所以时间线是2015年。 0 引言 人脸检测是CV社区中一直研究的问题,现在大多的人脸检测器都可以很容易的检测正脸或者接近正脸。所以人们开始关心如何解决在无约束条 阅读全文
posted @ 2018-11-15 09:45 仙守 阅读(694) 评论(0) 推荐(0) 编辑
摘要:为了实现标注平台智能辅助标注的能力,即上传一个标注任务,开始不提供辅助任务,随着用户标注的进行,后台可以收集一部分的标记数据,然后开启模型训练,并接着提供模型服务功能。然后再收集数据,再不断的训练,然后更新服务端的模型。随着标记的进行,模型的准确度也会越来越高。从而达到随着时间的进行,人工标注会从最 阅读全文
posted @ 2018-10-30 16:49 仙守 阅读(774) 评论(0) 推荐(0) 编辑
摘要:这里翻译下《Deep face recognition: a survey v4》. 1 引言 由于它的非侵入性和自然特征,人脸识别已经成为身份识别中重要的生物认证技术,也已经应用到许多领域,如军事,进入,公共安全和日常生活。FR自然在CVPR会议中也占据了十分长的时间。早在1990年代,随着特征脸 阅读全文
posted @ 2018-10-18 22:08 仙守 阅读(19183) 评论(2) 推荐(3) 编辑
摘要:本文译自《Deep learning for understanding faces: Machines may be just as good, or better, than humans》。为了方便,文中论文索引位置保持不变,方便直接去原文中找参考文献。 近些年深度卷积神经网络的发展将各种目标 阅读全文
posted @ 2018-10-14 22:02 仙守 阅读(5833) 评论(1) 推荐(1) 编辑
摘要:0. 引言 神经网络中的注意机制就是参考人类的视觉注意机制原理。即人眼在聚焦视野区域中某个小区域时,会投入更多的注意力到这个区域,即以“高分辨率”聚焦于图像的某个区域,同时以“低分辨率”感知周围图像,然后随着时间的推移调整焦点。 参考文献: 1. " arxiv ] .[attention sear 阅读全文
posted @ 2018-03-22 11:31 仙守 阅读(774) 评论(0) 推荐(0) 编辑
摘要:0. 背景 Junbo Zhao等人提出的“基于能量的GAN”网络,其将判别器视为一个能量函数而不需要明显的概率解释,该函数可以是一个可训练的损失函数。能量函数是将靠近真实数据流形的区域视为低能量区域,而远离的视为高能量区域。和“概率GAN”相似,训练中,生成器会尽可能生成最小能量时候的伪造样本,而 阅读全文
posted @ 2018-03-01 23:29 仙守 阅读(1763) 评论(0) 推荐(0) 编辑
摘要:0 背景 在这之前大家在训练GAN的时候,使用的loss函数都是sigmoid_cross_entropy_loss函数,然而xudon mao等人发现当使用伪造样本去更新生成器(且此时伪造样本也被判别器判为对的时候)会导致梯度消失的问题。虽然此时伪造样本仍然离真实样本分布距离还挺远。也就是之前的损 阅读全文
posted @ 2018-02-24 22:59 仙守 阅读(1525) 评论(2) 推荐(0) 编辑
摘要:###0.背景 Tim Salimans等人认为之前的GANs虽然可以生成很好的样本,然而训练GAN本质是找到一个基于连续的,高维参数空间上的非凸游戏上的纳什平衡。然而不幸的是,寻找纳什平衡是一个十分困难的问题。在现有的针对特定场景算法中,GAN的实现通常是使用梯度下降的方法去训练GAN网络的目标函 阅读全文
posted @ 2018-01-19 22:32 仙守 阅读(2297) 评论(0) 推荐(0) 编辑
摘要:引言中已经较为详细的介绍了GAN的理论基础和模型本身的原理。这里主要是研读Goodfellow的第一篇GAN论文。 ###0. 对抗网络 如引言中所述,对抗网络其实就是一个零和游戏中的2人最小最大游戏,主要就是为了处理下面的函数$V(G,D)$: 在实现过程中,如果将D和G都写入同一个循环中,即迭代 阅读全文
posted @ 2018-01-03 18:52 仙守 阅读(2406) 评论(0) 推荐(0) 编辑
摘要:###0.背景 通过对《tensorflow machine learning cookbook》第9章第3节"implementing_lstm"进行阅读,发现如下形式可以很方便的进行训练和预测,通过类进行定义,并利用了tf中的变量重用的能力,使得在训练阶段模型的许多变量,比如权重等,能够直接用在 阅读全文
posted @ 2018-01-02 13:40 仙守 阅读(2026) 评论(0) 推荐(0) 编辑
摘要:###0. 背景 通过阅读书籍《Pro Deep Learning with TensorFlow: A Mathematical Approach to Advanced Artificial Intelligence in Python》的第6章第4节的《Generative Adversari 阅读全文
posted @ 2017-12-27 17:53 仙守 阅读(902) 评论(0) 推荐(0) 编辑
摘要:###0. 背景 ###1. CTC原理 图 CTC结构图 CTC是看似和HMM有些联系,然后也采用DP来进行求解,将CTC结构图中<RNN输出,CTC层>单独拿出来,得到如下形式: 图 用前向-后向算法计算CTC 上图如CTC结构图, 最开始只能以(-)或者标签序列中第一个字符开始,即这里的t=1 阅读全文
posted @ 2017-12-14 11:14 仙守 阅读(1886) 评论(2) 推荐(1) 编辑