论文理解 - 随笔分类(第2页) - aoru45

[论文理解] Automatic fabric defect detection using a deep convolutional neural network

摘要：Automatic fabric defect detection using a deep convolutional neural network Intro 本文提出用于纺织品的瑕疵检测方法，将原始图片看成由若干patch组成的图片，利用对patch间距离的定义，求取二阶微分的最大值，进而得到阅读全文

posted @ 2020-01-30 20:57 aoru45 阅读(818) 评论(0) 推荐(0) 编辑

[论文理解] Making Convolutional Networks Shift-Invariant Again

摘要：Making Convolutional Networks Shift Invariant Again Intro 本文提出解决CNN平移不变性丧失的方法，之前说了CNN中的downsample过程由于不满足采样定理，所以没法确保平移不变性。信号处理里面解决这样的问题是利用增大采样频率或者用抗混叠方阅读全文

posted @ 2020-01-23 03:20 aoru45 阅读(1694) 评论(1) 推荐(0) 编辑

[论文理解] Why do deep convolutional networks generalize so poorly to small image transformations?

摘要：Why do deep convolutional networks generalize so poorly to small image transformations? Intro CNN的设计初衷是为了使得模型具有微小平移、旋转不变性，而实际上本文通过实验验证了现在比较流行的神经网络都已经丧阅读全文

posted @ 2020-01-21 19:35 aoru45 阅读(859) 评论(3) 推荐(0) 编辑

[论文理解] FoveaBox: Beyond Anchor-based Object Detector

摘要：FoveaBox: Beyond Anchor based Object Detector Intro 本文是一篇one stage anchor free的目标检测文章，大体检测思路为，网络分两路，一路预测k个channel的map，每个channel代表一个类别的概率，即输出为w×h×k，另一路阅读全文

posted @ 2019-11-27 00:30 aoru45 阅读(361) 评论(0) 推荐(0) 编辑

[论文理解] Acquisition of Localization Confidence for Accurate Object Detection

摘要：Acquisition of Localization Confidence for Accurate Object Detection Intro 目标检测领域的问题有很多，本文的作者捕捉到了这样一个问题，就是nms算法根据类别置信度为准则去删掉与他iou大于一定阈值的算法是否合理？事实是，分类置阅读全文

posted @ 2019-11-25 19:20 aoru45 阅读(1051) 评论(0) 推荐(0) 编辑

[论文理解] An Analysis of Scale Invariance in Object Detection – SNIP

摘要：An Analysis of Scale Invariance in Object Detection – SNIP 简介小目标问题一直是目标检测领域一个比较难解决的问题，因为小目标提供的信息比较少，当前的很多目标检测框架并不能充分捕捉小目标的全部信息，这导致了小目标检测的MAP比较低，在COCO 阅读全文

posted @ 2019-11-23 23:46 aoru45 阅读(784) 评论(0) 推荐(0) 编辑

[论文理解] Attentional Pooling for Action Recognition

摘要：Attentional Pooling for Action Recognition 简介这是一篇NIPS的文章，文章亮点是对池化进行矩阵表示，使用二阶池的矩阵表示，并将权重矩阵进行低秩分解，从而使分解后的结果能够自底向上和自顶向下的解释，并巧用attention机制来解释，我感觉学到了很多东西，阅读全文

posted @ 2019-10-27 13:21 aoru45 阅读(1375) 评论(0) 推荐(0) 编辑

[论文理解] CapsuleNet

摘要：CapsuleNet 前言找了很多资料，终于把整个流程搞懂了，其实要懂这个运算并不难，难的对我来说是怎么用代码实现，也找了github上的一些代码来看，对我来说都有点冗长，变量分布太远导致我脑袋炸了，所以我就在B站找视频看看有没有代码讲解，算是不负苦心吧，终于把实现部分解决了。不写论文解读，因为阅读全文

posted @ 2019-10-14 02:14 aoru45 阅读(1298) 评论(0) 推荐(0) 编辑

[论文理解] Learning Efficient Convolutional Networks through Network Slimming

摘要：Learning Efficient Convolutional Networks through Network Slimming 简介这是我看的第一篇模型压缩方面的论文，应该也算比较出名的一篇吧，因为很早就对模型压缩比较感兴趣，所以抽了个时间看了一篇，代码也自己实现了一下，觉得还是挺容易的。这阅读全文

posted @ 2019-10-01 00:42 aoru45 阅读(3985) 评论(1) 推荐(1) 编辑

[论文理解] Receptive Field Block Net for Accurate and Fast Object Detection

摘要：Receptive Field Block Net for Accurate and Fast Object Detection 简介本文在SSD基础上提出了RFB Module，利用神经科学的先验知识来解释这种效果提升。本质上是设计一种新的结构来提升感受野，并表明了人类视网膜的感受野有一个特点，阅读全文

posted @ 2019-09-26 23:07 aoru45 阅读(1308) 评论(0) 推荐(1) 编辑

[论文理解] SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimation

摘要：SSR Net: A Compact Soft Stagewise Regression Network for Age Estimation 简介本文提出了一种年龄回归的方法，定义了由粗到细进行classification的过程，并且取得了不错的实验效果。文章指出，regression base 阅读全文

posted @ 2019-09-14 02:29 aoru45 阅读(549) 评论(1) 推荐(0) 编辑

[论文理解] CBAM: Convolutional Block Attention Module

摘要：CBAM: Convolutional Block Attention Module 简介本文利用attention机制，使得针对网络有了更好的特征表示，这种结构通过支路学习到通道间关系的权重和像素间关系的权重，然后乘回到原特征图，使得特征图可以更好的表示。 Convolutional Block 阅读全文

posted @ 2019-09-12 02:26 aoru45 阅读(982) 评论(0) 推荐(0) 编辑

[论文理解] Spatial Transformer Networks

摘要：Spatial Transformer Networks 简介本文提出了能够学习feature仿射变换的一种结构，并且该结构不需要给其他额外的监督信息，网络自己就能学习到对预测结果有用的仿射变换。因为CNN的平移不变性等空间特征一定程度上被pooling等操作破坏了，所以，想要网络能够应对平移的o 阅读全文

posted @ 2019-09-08 22:36 aoru45 阅读(1554) 评论(0) 推荐(0) 编辑

[论文理解] Squeeze-and-Excitation Networks

摘要：Squeeze and Excitation Networks 简介 SENet提出了一种更好的特征表示结构，通过支路结构学习作用到input上更好的表示feature。结构上是使用一个支路去学习如何评估通道间的关联，然后作用到原feature map上去，实现对输入的校准。支路的帮助学习到的是神经阅读全文

posted @ 2019-09-08 15:27 aoru45 阅读(1611) 评论(0) 推荐(1) 编辑

[论文理解] LFFD: A Light and Fast Face Detector for Edge Devices

摘要：LFFD: A Light and Fast Face Detector for Edge Devices 摘要从微信推文中得知此人脸识别算法可以在跑2K图片90fps，仔细一看是在RTX2070下使用tensorrt下才能达到。最近刚好有个目标检测的任务，检测的目的其实差不多，我们篮球组比赛中需阅读全文

posted @ 2019-09-04 00:39 aoru45 阅读(4118) 评论(7) 推荐(0) 编辑

[论文笔记] Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment

摘要：Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment 简介本文提出了一种网络结构，不是利用分类和回归loss加权求和，提出对数据集进行裁剪来提高准确率的方法，在很多数据集上取得了阅读全文

posted @ 2019-07-15 01:02 aoru45 阅读(585) 评论(0) 推荐(0) 编辑

[论文笔记] Fine-Grained Head Pose Estimation Without Keypoints

摘要：Fine Grained Head Pose Estimation Without Keypoints 简介 head pose estimation 经典论文，使用CNN预测三个角度值，pitch,yaw,roll,本文提出一种combined classification and regress 阅读全文

posted @ 2019-07-15 00:48 aoru45 阅读(2591) 评论(1) 推荐(0) 编辑

[论文理解] CornerNet: Detecting Objects as Paired Keypoints

摘要：[论文理解] CornerNet: Detecting Objects as Paired Keypoints 简介首先这是一篇anchor free的文章，看了之后觉得方法挺好的，预测左上角和右下角，这样不需要去管anchor了，理论上也就w\ h个点，这总比好几万甚至好几十万的anchor容易阅读全文

posted @ 2019-06-04 23:03 aoru45 阅读(790) 评论(0) 推荐(0) 编辑

[论文理解]关于ResNet的进一步理解

摘要：[论文理解]关于ResNet的理解这两天回忆起resnet，感觉残差结构还是不怎么理解（可能当时理解了，时间长了忘了吧），重新梳理一下两点，关于resnet结构的思考。要解决什么问题论文的一大贡献就是，证明了即使是深度网络，也可以通过训练达到很好的效果，这跟以往的经验不同，以往由于网络层数的加阅读全文

posted @ 2019-04-30 20:42 aoru45 阅读(836) 评论(0) 推荐(1) 编辑

[论文理解]Focal Loss for Dense Object Detection（Retina Net）

摘要：Focal Loss for Dense Object Detection Intro 这又是一篇与何凯明大神有关的作品，文章主要解决了one-stage网络识别率普遍低于two-stage网络的问题，其指出其根本原因是样本类别不均衡导致，一针见血，通过改变传统的loss（CE）变为focal lo 阅读全文

posted @ 2019-03-26 20:53 aoru45 阅读(3958) 评论(0) 推荐(0) 编辑

漂流，浪客

浪迹走天涯。

随笔分类 - 论文理解

公告