随笔分类 -  论文理解

摘要:Automatic fabric defect detection using a deep convolutional neural network Intro 本文提出用于纺织品的瑕疵检测方法,将原始图片看成由若干patch组成的图片,利用对patch间距离的定义,求取二阶微分的最大值,进而得到 阅读全文
posted @ 2020-01-30 20:57 aoru45 阅读(798) 评论(0) 推荐(0) 编辑
摘要:Making Convolutional Networks Shift Invariant Again Intro 本文提出解决CNN平移不变性丧失的方法,之前说了CNN中的downsample过程由于不满足采样定理,所以没法确保平移不变性。信号处理里面解决这样的问题是利用增大采样频率或者用抗混叠方 阅读全文
posted @ 2020-01-23 03:20 aoru45 阅读(1651) 评论(1) 推荐(0) 编辑
摘要:Why do deep convolutional networks generalize so poorly to small image transformations? Intro CNN的设计初衷是为了使得模型具有微小平移、旋转不变性,而实际上本文通过实验验证了现在比较流行的神经网络都已经丧 阅读全文
posted @ 2020-01-21 19:35 aoru45 阅读(839) 评论(3) 推荐(0) 编辑
摘要:FoveaBox: Beyond Anchor based Object Detector Intro 本文是一篇one stage anchor free的目标检测文章,大体检测思路为,网络分两路,一路预测k个channel的map,每个channel代表一个类别的概率,即输出为w×h×k,另一路 阅读全文
posted @ 2019-11-27 00:30 aoru45 阅读(353) 评论(0) 推荐(0) 编辑
摘要:Acquisition of Localization Confidence for Accurate Object Detection Intro 目标检测领域的问题有很多,本文的作者捕捉到了这样一个问题,就是nms算法根据类别置信度为准则去删掉与他iou大于一定阈值的算法是否合理?事实是,分类置 阅读全文
posted @ 2019-11-25 19:20 aoru45 阅读(1043) 评论(0) 推荐(0) 编辑
摘要:An Analysis of Scale Invariance in Object Detection – SNIP 简介 小目标问题一直是目标检测领域一个比较难解决的问题,因为小目标提供的信息比较少,当前的很多目标检测框架并不能充分捕捉小目标的全部信息,这导致了小目标检测的MAP比较低,在COCO 阅读全文
posted @ 2019-11-23 23:46 aoru45 阅读(769) 评论(0) 推荐(0) 编辑
摘要:Attentional Pooling for Action Recognition 简介 这是一篇NIPS的文章,文章亮点是对池化进行矩阵表示,使用二阶池的矩阵表示,并将权重矩阵进行低秩分解,从而使分解后的结果能够自底向上和自顶向下的解释,并巧用attention机制来解释,我感觉学到了很多东西, 阅读全文
posted @ 2019-10-27 13:21 aoru45 阅读(1273) 评论(0) 推荐(0) 编辑
摘要:CapsuleNet 前言 找了很多资料,终于把整个流程搞懂了,其实要懂这个运算并不难,难的对我来说是怎么用代码实现,也找了github上的一些代码来看,对我来说都有点冗长,变量分布太远导致我脑袋炸了,所以我就在B站找视频看看有没有代码讲解,算是不负苦心吧,终于把实现部分解决了。 不写论文解读,因为 阅读全文
posted @ 2019-10-14 02:14 aoru45 阅读(1270) 评论(0) 推荐(0) 编辑
摘要:Learning Efficient Convolutional Networks through Network Slimming 简介 这是我看的第一篇模型压缩方面的论文,应该也算比较出名的一篇吧,因为很早就对模型压缩比较感兴趣,所以抽了个时间看了一篇,代码也自己实现了一下,觉得还是挺容易的。这 阅读全文
posted @ 2019-10-01 00:42 aoru45 阅读(3938) 评论(1) 推荐(1) 编辑
摘要:Receptive Field Block Net for Accurate and Fast Object Detection 简介 本文在SSD基础上提出了RFB Module,利用神经科学的先验知识来解释这种效果提升。本质上是设计一种新的结构来提升感受野,并表明了人类视网膜的感受野有一个特点, 阅读全文
posted @ 2019-09-26 23:07 aoru45 阅读(1258) 评论(0) 推荐(1) 编辑
摘要:SSR Net: A Compact Soft Stagewise Regression Network for Age Estimation 简介 本文提出了一种年龄回归的方法,定义了由粗到细进行classification的过程,并且取得了不错的实验效果。文章指出,regression base 阅读全文
posted @ 2019-09-14 02:29 aoru45 阅读(519) 评论(1) 推荐(0) 编辑
摘要:CBAM: Convolutional Block Attention Module 简介 本文利用attention机制,使得针对网络有了更好的特征表示,这种结构通过支路学习到通道间关系的权重和像素间关系的权重,然后乘回到原特征图,使得特征图可以更好的表示。 Convolutional Block 阅读全文
posted @ 2019-09-12 02:26 aoru45 阅读(961) 评论(0) 推荐(0) 编辑
摘要:Spatial Transformer Networks 简介 本文提出了能够学习feature仿射变换的一种结构,并且该结构不需要给其他额外的监督信息,网络自己就能学习到对预测结果有用的仿射变换。因为CNN的平移不变性等空间特征一定程度上被pooling等操作破坏了,所以,想要网络能够应对平移的o 阅读全文
posted @ 2019-09-08 22:36 aoru45 阅读(1482) 评论(0) 推荐(0) 编辑
摘要:Squeeze and Excitation Networks 简介 SENet提出了一种更好的特征表示结构,通过支路结构学习作用到input上更好的表示feature。结构上是使用一个支路去学习如何评估通道间的关联,然后作用到原feature map上去,实现对输入的校准。支路的帮助学习到的是神经 阅读全文
posted @ 2019-09-08 15:27 aoru45 阅读(1593) 评论(0) 推荐(1) 编辑
摘要:LFFD: A Light and Fast Face Detector for Edge Devices 摘要 从微信推文中得知此人脸识别算法可以在跑2K图片90fps,仔细一看是在RTX2070下使用tensorrt下才能达到。最近刚好有个目标检测的任务,检测的目的其实差不多,我们篮球组比赛中需 阅读全文
posted @ 2019-09-04 00:39 aoru45 阅读(4083) 评论(7) 推荐(0) 编辑
摘要:Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment 简介 本文提出了一种网络结构,不是利用分类和回归loss加权求和,提出对数据集进行裁剪来提高准确率的方法,在很多数据集上取得了 阅读全文
posted @ 2019-07-15 01:02 aoru45 阅读(580) 评论(0) 推荐(0) 编辑
摘要:Fine Grained Head Pose Estimation Without Keypoints 简介 head pose estimation 经典论文,使用CNN预测三个角度值,pitch,yaw,roll,本文提出一种combined classification and regress 阅读全文
posted @ 2019-07-15 00:48 aoru45 阅读(2566) 评论(1) 推荐(0) 编辑
摘要:[论文理解] CornerNet: Detecting Objects as Paired Keypoints 简介 首先这是一篇anchor free的文章,看了之后觉得方法挺好的,预测左上角和右下角,这样不需要去管anchor了,理论上也就w\ h个点,这总比好几万甚至好几十万的anchor容易 阅读全文
posted @ 2019-06-04 23:03 aoru45 阅读(785) 评论(0) 推荐(0) 编辑
摘要:[论文理解]关于ResNet的理解 这两天回忆起resnet,感觉残差结构还是不怎么理解(可能当时理解了,时间长了忘了吧),重新梳理一下两点,关于resnet结构的思考。 要解决什么问题 论文的一大贡献就是,证明了即使是深度网络,也可以通过训练达到很好的效果,这跟以往的经验不同,以往由于网络层数的加 阅读全文
posted @ 2019-04-30 20:42 aoru45 阅读(829) 评论(0) 推荐(1) 编辑
摘要:Focal Loss for Dense Object Detection Intro 这又是一篇与何凯明大神有关的作品,文章主要解决了one-stage网络识别率普遍低于two-stage网络的问题,其指出其根本原因是样本类别不均衡导致,一针见血,通过改变传统的loss(CE)变为focal lo 阅读全文
posted @ 2019-03-26 20:53 aoru45 阅读(3926) 评论(0) 推荐(0) 编辑