随笔分类 -  机器视觉

机器视觉笔记
摘要:On the "steerability" of generative adversarial networks Intro 本文提出对GAN的latent space进行操作的一种方法,通过对latent space的编辑实现生成域外样本,操控生成样本的基本属性,如控制生成样本的位置、光照、二维旋 阅读全文
posted @ 2020-01-30 23:51 aoru45 阅读(843) 评论(0) 推荐(0) 编辑
摘要:Automatic fabric defect detection using a deep convolutional neural network Intro 本文提出用于纺织品的瑕疵检测方法,将原始图片看成由若干patch组成的图片,利用对patch间距离的定义,求取二阶微分的最大值,进而得到 阅读全文
posted @ 2020-01-30 20:57 aoru45 阅读(798) 评论(0) 推荐(0) 编辑
摘要:Making Convolutional Networks Shift Invariant Again Intro 本文提出解决CNN平移不变性丧失的方法,之前说了CNN中的downsample过程由于不满足采样定理,所以没法确保平移不变性。信号处理里面解决这样的问题是利用增大采样频率或者用抗混叠方 阅读全文
posted @ 2020-01-23 03:20 aoru45 阅读(1651) 评论(1) 推荐(0) 编辑
摘要:Why do deep convolutional networks generalize so poorly to small image transformations? Intro CNN的设计初衷是为了使得模型具有微小平移、旋转不变性,而实际上本文通过实验验证了现在比较流行的神经网络都已经丧 阅读全文
posted @ 2020-01-21 19:35 aoru45 阅读(839) 评论(3) 推荐(0) 编辑
摘要:Nvidia AGX Xavier刷机过程中报错及解决 注意事项 1. 不需要在host主机上装Cuda之类的,所以在SDKManager里可不勾选 2. 安装的时候线一定要对 3. 刷机时刷4.2.3的,有tensorflow可选,记得一定要选(任务需要) 4. 如遇错误突然终止,肯定跟本机的py 阅读全文
posted @ 2019-12-28 17:02 aoru45 阅读(3462) 评论(0) 推荐(0) 编辑
摘要:Gibbs Sampling Intro Gibbs Sampling 方法是我最近在看概率图模型相关的论文的时候遇见的,采样方法大致为:迭代抽样,最开始从随机样本中抽样,然后将此样本作为条件项,按条件概率抽样,每次只从一个维度考虑,当所有维度均采样完,开始下一轮迭代。 Random Samplin 阅读全文
posted @ 2019-12-24 16:59 aoru45 阅读(6811) 评论(0) 推荐(4) 编辑
摘要:MRF马尔可夫随机场入门 Intro MRF是一种广泛应用于图像分割的模型,当然我看到MRF的时候并不是因为分割,而是在图像生成领域,有的paper利用MRF模型来生成图像,因此入门一下MRF,并以分割模型为例记一下代码。 Model Target 在图像分割中,我们的任务是给定一张图像,输出每个像 阅读全文
posted @ 2019-12-22 14:20 aoru45 阅读(4230) 评论(1) 推荐(0) 编辑
摘要:FoveaBox: Beyond Anchor based Object Detector Intro 本文是一篇one stage anchor free的目标检测文章,大体检测思路为,网络分两路,一路预测k个channel的map,每个channel代表一个类别的概率,即输出为w×h×k,另一路 阅读全文
posted @ 2019-11-27 00:30 aoru45 阅读(353) 评论(0) 推荐(0) 编辑
摘要:Acquisition of Localization Confidence for Accurate Object Detection Intro 目标检测领域的问题有很多,本文的作者捕捉到了这样一个问题,就是nms算法根据类别置信度为准则去删掉与他iou大于一定阈值的算法是否合理?事实是,分类置 阅读全文
posted @ 2019-11-25 19:20 aoru45 阅读(1043) 评论(0) 推荐(0) 编辑
摘要:Attentional Pooling for Action Recognition 简介 这是一篇NIPS的文章,文章亮点是对池化进行矩阵表示,使用二阶池的矩阵表示,并将权重矩阵进行低秩分解,从而使分解后的结果能够自底向上和自顶向下的解释,并巧用attention机制来解释,我感觉学到了很多东西, 阅读全文
posted @ 2019-10-27 13:21 aoru45 阅读(1273) 评论(0) 推荐(0) 编辑
摘要:Receptive Field Block Net for Accurate and Fast Object Detection 简介 本文在SSD基础上提出了RFB Module,利用神经科学的先验知识来解释这种效果提升。本质上是设计一种新的结构来提升感受野,并表明了人类视网膜的感受野有一个特点, 阅读全文
posted @ 2019-09-26 23:07 aoru45 阅读(1258) 评论(0) 推荐(1) 编辑
摘要:SSR Net: A Compact Soft Stagewise Regression Network for Age Estimation 简介 本文提出了一种年龄回归的方法,定义了由粗到细进行classification的过程,并且取得了不错的实验效果。文章指出,regression base 阅读全文
posted @ 2019-09-14 02:29 aoru45 阅读(519) 评论(1) 推荐(0) 编辑
摘要:Spatial Transformer Networks 简介 本文提出了能够学习feature仿射变换的一种结构,并且该结构不需要给其他额外的监督信息,网络自己就能学习到对预测结果有用的仿射变换。因为CNN的平移不变性等空间特征一定程度上被pooling等操作破坏了,所以,想要网络能够应对平移的o 阅读全文
posted @ 2019-09-08 22:36 aoru45 阅读(1482) 评论(0) 推荐(0) 编辑
摘要:Squeeze and Excitation Networks 简介 SENet提出了一种更好的特征表示结构,通过支路结构学习作用到input上更好的表示feature。结构上是使用一个支路去学习如何评估通道间的关联,然后作用到原feature map上去,实现对输入的校准。支路的帮助学习到的是神经 阅读全文
posted @ 2019-09-08 15:27 aoru45 阅读(1593) 评论(0) 推荐(1) 编辑
摘要:LFFD: A Light and Fast Face Detector for Edge Devices 摘要 从微信推文中得知此人脸识别算法可以在跑2K图片90fps,仔细一看是在RTX2070下使用tensorrt下才能达到。最近刚好有个目标检测的任务,检测的目的其实差不多,我们篮球组比赛中需 阅读全文
posted @ 2019-09-04 00:39 aoru45 阅读(4083) 评论(7) 推荐(0) 编辑
摘要:Pytorch Guided Backpropgation Intro guided backpropgation通过修改RELU的梯度反传,使得小于0的部分不反传,只传播大于0的部分,这样到第一个conv层的时候得到的梯度就是对后面relu激活起作用的梯度,这时候我们对这些梯度进行可视化,得到的就 阅读全文
posted @ 2019-08-13 17:21 aoru45 阅读(1597) 评论(0) 推荐(0) 编辑
摘要:Improving Head Pose Estimation with a Combined Loss and Bounding Box Margin Adjustment 简介 本文提出了一种网络结构,不是利用分类和回归loss加权求和,提出对数据集进行裁剪来提高准确率的方法,在很多数据集上取得了 阅读全文
posted @ 2019-07-15 01:02 aoru45 阅读(580) 评论(0) 推荐(0) 编辑
摘要:Fine Grained Head Pose Estimation Without Keypoints 简介 head pose estimation 经典论文,使用CNN预测三个角度值,pitch,yaw,roll,本文提出一种combined classification and regress 阅读全文
posted @ 2019-07-15 00:48 aoru45 阅读(2566) 评论(1) 推荐(0) 编辑
摘要:[论文理解] CornerNet: Detecting Objects as Paired Keypoints 简介 首先这是一篇anchor free的文章,看了之后觉得方法挺好的,预测左上角和右下角,这样不需要去管anchor了,理论上也就w\ h个点,这总比好几万甚至好几十万的anchor容易 阅读全文
posted @ 2019-06-04 23:03 aoru45 阅读(785) 评论(0) 推荐(0) 编辑
摘要:直方图均衡化 效果 代码 原理 图像直方图的原始分布: 目标分布: $$ F_Y(y) = P\lbrace Y\leq y \rbrace = P \lbrace T(X) \leq y \rbrace = P \lbrace X \leq T^{ 1}(y) \rbrace = F_X(T^{ 阅读全文
posted @ 2019-03-31 21:31 aoru45 阅读(3317) 评论(0) 推荐(0) 编辑