随笔分类 -  DL&&CV论文

该文被密码保护。
posted @ 2020-06-01 09:36 三年一梦 阅读(1) 评论(0) 推荐(0) 编辑
该文被密码保护。
posted @ 2020-05-01 15:07 三年一梦 编辑
摘要:一篇GAN与AE结合的文章,用于探索AE相较GAN的生成能力和解耦表示。构建了两种AE:MLP和StyleGAN。结构如下: 把原生GAN中的G分解为F与G的映射,D分解为E与D的映射: F是一个确定性的映射,将噪声z编码成隐变量w。 E和G是随机的,G同时取决于隐变量w和噪声的输入。E将生成的图像 阅读全文
posted @ 2020-04-28 18:54 三年一梦 编辑
摘要:本文用正交softmax层来减轻少样本分类利用NN做易过拟合的问题。思路是:对于分类器的分类权重层,令其正交化。就是分类器的权重向量两两正交化。原理比较清晰易懂,实现时将权重向量的部分链接进行移除(dropout),但是这个移除在训练和测试是固定的,不是学习的,没有在优化过程中进行限制。本文的方法叫 阅读全文
posted @ 2020-04-26 17:02 三年一梦 阅读(461) 评论(0) 推荐(0) 编辑
摘要:一篇总结整理近来few-shot分类的文章(近来文章一些毛病:code实现细节很难说清真正的gain在哪,一些baseline被压得太低,base类和novel类之间的域差异不明显导致评估也不可能不太准)。作者复现了一下主要的几篇工作,然后总结如下:更深的backbone在不同域上的表现对于不同方法 阅读全文
posted @ 2020-04-25 18:44 三年一梦 阅读(2004) 评论(0) 推荐(0) 编辑
摘要:提出一种成为MFR(Meta Face Recognition)的方法用于解决在未知域模型泛化的paper。如下图所示,左边为四个源域,右边为5个目标域,通过将源域迭代划分成meta-train/meta-test集合可以提升模型的迁移性能,使得在未知域上也会能有较好的结果。 在真实应用中通常有两种 阅读全文
posted @ 2020-04-24 17:26 三年一梦 阅读(2261) 评论(0) 推荐(0) 编辑
摘要:转载于: 一行代码提升迁移性能 | CVPR2020 Oral 在迁移任务中,目标域由于没有标签,常常导致分界面附近混淆较多的数据。而我们基于这一现象,分析了批量类别响应组成的批量矩阵A,并希望从判别性和迁移性进行优化。 判别性 所谓判别性,指的是预测类别的过程是否坚定。比如对于二类问题的响应 [0 阅读全文
posted @ 2020-04-06 13:48 三年一梦 编辑
摘要:一篇在SinGAN上改进的论文,特点是更可控,训练更快20-30min。代码开源:ConSinGAN 主要贡献: 并行训练多个阶段 没有在中间阶段生成图像,而是传播特征 提升训练过程的尺度步骤,比之前需要的训练阶段更少 利用微调来应用多个应用领域 阅读全文
posted @ 2020-03-31 16:42 三年一梦 编辑
摘要:这篇稍老一点,18年的用GAN做reid的paper,和上篇19年将输入分解为appearance和structure不同。这篇FD-GAN是希望提到的特征仅仅和id有关,而和姿势无关。所以将输入分解为id+pose。编码器可视化如下: FD-GAN尽量在同一id姿态改变的情况下保持id特征的不变。 阅读全文
posted @ 2020-03-29 21:54 三年一梦 阅读(866) 评论(0) 推荐(0) 编辑
摘要:关于利用GAN做行人ReID的文章: [NIPS-2018] FD-GAN: Pose-guided Feature Distilling GAN for Robust Person Re-identification。 [CVPR2019] Joint Discriminative and Gen 阅读全文
posted @ 2020-03-27 21:54 三年一梦 阅读(1207) 评论(0) 推荐(0) 编辑
摘要:一篇解决图像识别问题中“长尾分布”的论文,也是cvpr20的oral,想法简洁有效:解耦分类网络的特征学习层和分类层。论文地址:BBN 。 常见的物体类别在识别问题中占据主导地位,而罕见的类别则数据较少。长尾分布在某种程度上可以视作比正态分布更广泛存在的一种自然分布,现实中主要表现在少量个体做出大量 阅读全文
posted @ 2020-03-17 11:42 三年一梦 阅读(3577) 评论(2) 推荐(1) 编辑
摘要:一篇19年语义合成图像的文章。认为直接利用正则层会洗掉图像中原有的语义信息。提出了一种spatially-adaptive的正则化。 条件图像合成方法区别在于输入数据的类型。例如以类别为条件的模型、以图像为输入的image-to-image等。非条件正则层包括Local Response Norma 阅读全文
posted @ 2020-03-13 19:44 三年一梦 编辑
摘要:该论文提出一种新的方法从素描来合成完全详细的艺术风格化图像。给定素描图,没有语义标签,给定一个特定风格的参考图。文中引入三个模块来学习,得到了高质量的结果。样例图如下: 介绍 近来的工作主要集中在合成照片上的真实图像,或者从草图上合成卡通图像。本文集中于素描+特定风格。本文的方法更加generic。 阅读全文
posted @ 2020-03-09 21:14 三年一梦 阅读(818) 评论(0) 推荐(0) 编辑
摘要:摘要 提出一种新的图像表示称为face X-ray,用于检测伪造的人脸。一个输入人脸的face X-ray是灰度图,可表明输入图是否可分解为两张不同源图像的合成。它通过显示伪造图像的混合边界和真实图像的absence来实现。绝大多数人脸变换算法有一个共同步骤:将更改后的脸部混合到现有背景图像中。为此 阅读全文
posted @ 2020-01-27 17:30 三年一梦 阅读(1585) 评论(0) 推荐(1) 编辑
摘要:摘要 提出一种双阶段框架实现高保真和对遮挡感知的换脸。之前的方法只利用了目标脸的信息。本文的方法第一阶段生成高保真的脸,具体通过属性编码来提取多级目标人脸的属性,和一个新的生成器来自适应嵌入身份类别和属性。为了解决面部遮挡,第二阶段利用HEAR-Net通过自监督方法来恢复这些有问题(遮挡物)的区域。 阅读全文
posted @ 2020-01-26 13:51 三年一梦 阅读(1520) 评论(0) 推荐(0) 编辑
摘要:转载自:Chris Choy's blog Universal Correspondence Network In this post, we will give a very high-level overview of the paper in layman’s terms. I’ve rece 阅读全文
posted @ 2019-05-03 22:25 三年一梦 阅读(779) 评论(0) 推荐(0) 编辑
摘要:承接上上篇博客,在其基础上,加入了Wasserstein distance和correlation prior 。其他相关工作、网络细节(maxout operator)、训练方式和数据处理等基本和前文一致。以下是这两点改进的大概: Wasserstein convolutional neural 阅读全文
posted @ 2018-11-25 18:11 三年一梦 阅读(1431) 评论(1) 推荐(0) 编辑
摘要:承接上一篇博客。该论文思路清晰,实验充分,这里大致写一些比较不错的idea。从标题就能看出本文的主要贡献:轻量、鲁棒。利用一个轻量CNN从大规模数据且含大量噪声中来学习一个深度面部表征。 直接谈谈贡献: 本文介绍MFM操作,一种特殊的maxout来学习少参数网络。相比于ReLU从数据中学来阈值,MF 阅读全文
posted @ 2018-11-24 09:14 三年一梦 阅读(2603) 评论(0) 推荐(0) 编辑
摘要:查找异质图像匹配的过程中,发现几篇某组的论文,都是关于NIR-VIS的识别问题,提到了许多处理异质图像的处理方法,网络结构和idea都很不错,记录其中一篇。 其余两篇: Wasserstein CNN: Learning Invariant Features for NIR-VIS Face Rec 阅读全文
posted @ 2018-11-23 12:08 三年一梦 阅读(1323) 评论(0) 推荐(0) 编辑
摘要:一篇BMVC18的论文,关于semantic keypoints matching、dense matching的工作,感觉比纯patch matching有意思,记录一下。 1. 摘要 提出一种针对correspondence matching的直接解决方案。没有采用一贯的基于正负样本对(一般需要 阅读全文
posted @ 2018-11-20 16:28 三年一梦 阅读(1197) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示