Gaaray

2019年4月14日

Progressive Sparse Local Attention for Video object detection

摘要： motivation: 之前使用flownet的方法有诸多弊端。 1.在检测框架中加入光流网络极大地增加了检测器模型的参数，无法用在移动端。 2.光流原本是描述两张图片间像素点的位移的，直接将其用在high-level的feature map上会引入人为的干扰。特别的，high-level的feat 阅读全文

posted @ 2019-04-14 11:51 Gaaray 阅读(1278) 评论(0) 推荐(0) 编辑

2019年4月11日

AdaScale: Towards Real-time video object detection using adaptive scaling

摘要： motivation: 作者发现对图片进行降采样有时能有助于检测精度的提升。具体来说，图片降采样能带来两方面的提升： 1）减少false positive(fp)的数量，过多地关注图片上不必要的细节会引入false positive。 2）增加true positive(tp)的数量，通过对图片进行阅读全文

posted @ 2019-04-11 12:16 Gaaray 阅读(459) 评论(0) 推荐(0) 编辑

2019年4月10日

Patchwork: A Patch-wise Attention Network for Efficient Object Detection and Segmentation in Video Streams

摘要：文章链接：https://arxiv.org/abs/1904.01784v1 简介受人类视觉注意力系统的启发，文章提出了一个叫Patchwork的模型，利用了记忆和注意力之间的微妙的相互作用来进行高效的视频处理。图1:a) 视频流中的每个时间步，我们的方法仅仅处理当前帧的一个小的局部窗，但由于阅读全文

posted @ 2019-04-10 11:28 Gaaray 阅读(1024) 评论(0) 推荐(0) 编辑

2019年4月8日

【转】Looking Fast and Slow: Memory-Guided Mobile Video Object Detection

摘要：参考：https://mp.weixin.qq.com/s/Sq3dBuU8aY3Ug9NBZMc5lA Motivation 物体在快速运动时，当人眼所看到的影像消失后，人眼仍能继续保留其影像，约0.1-0.4秒左右的图像，这种现象被称为视觉暂留现象。人类在观看视频时，利用视觉暂留机制和记忆能力，阅读全文

posted @ 2019-04-08 16:35 Gaaray 阅读(1387) 评论(0) 推荐(0) 编辑

Towards High Performance Video Object Detection for Mobiles

摘要： motivation：近来以桌面版GPU为计算平台的视频目标检测取得了较多成果，如DFF,FGFA等，但这些算法没法用在移动端，移动端的计算资源有限不足以运行这些算法。本文提出了一个用于移动端的轻量化视频目标检测网络。在稀疏关键帧上运行轻量化的图片目标检测器，使用了一个非常小的轻光流网络来提取光阅读全文

posted @ 2019-04-08 11:23 Gaaray 阅读(458) 评论(0) 推荐(0) 编辑

2019年3月31日

目标检测中的precision，recall，AP，mAP计算详解

摘要：大雁与飞机假设现在有这样一个测试集，测试集中的图片只由大雁和飞机两种图片组成，如下图所示：假设你的分类系统最终的目的是：能取出测试集中所有飞机的图片，而不是大雁的图片。现在做如下的定义： True positives : 飞机的图片被正确的识别成了飞机。 True negatives: 大雁的阅读全文

posted @ 2019-03-31 16:29 Gaaray 阅读(7035) 评论(3) 推荐(2) 编辑

2019年3月24日

Fully Motion-Aware Network for Video Object Detection

摘要：来自清华的一篇文章，发表在ECCV2018上，是对FGFA做的改进。针对R-FCN这一目标检测算法做出的专有改进，目前看来这个方法只适合用在R-FCN，无法迁移到其他目标检测算法，如faster rcnn、SSD等。具体的做法是这样的，FGFA就是图中左半部分，分别提取相邻帧的图片特征，并用光流阅读全文

posted @ 2019-03-24 16:36 Gaaray 阅读(639) 评论(0) 推荐(0) 编辑

Object Detection in Video with Spatiotemporal Sampling Networks

摘要：发表在ECCV2018上，提出一种用可变形卷积做特征对齐的方法。与FGFA十分相似，思想都是单帧不够，多帧来凑，利用相邻帧的特征来对当前帧进行增强，以此来达到更好的检测效果。不同点在于FGFA是利用光流来对两张图片的特征进行对齐，这篇文章采用的是可变形卷积来做特征对齐。首先将当前帧和相邻帧经过阅读全文

posted @ 2019-03-24 16:27 Gaaray 阅读(984) 评论(0) 推荐(0) 编辑

Towards High Performance Video Object Detection

摘要：来自MSRA视觉计算组，发表在CVPR2018上，对DFF和FGFA的改进。 motivation 在DFF和FGFA的基础上提出三个改进对速度和精度进行权衡在DFF和FGFA的基础上提出三个改进对速度和精度进行权衡 DFF和FGFA分别专注于提高速度和精度，这篇文章尝试把两者的优势结合起来，阅读全文

posted @ 2019-03-24 16:05 Gaaray 阅读(591) 评论(0) 推荐(0) 编辑

Flow-Guided Feature Aggregation for Video Object Detection

摘要：来自MSRA视觉计算组，发表在ICCV2017上，提出了一个通过特征聚合来增强特征的方法。 motivation 视频中的退化现象很严重通过聚合多帧的特征来对每一帧特征进行增强用光流传播特征视频中的退化现象很严重通过聚合多帧的特征来对每一帧特征进行增强用光流传播特征视频目标检测中，存在图阅读全文

posted @ 2019-03-24 15:37 Gaaray 阅读(790) 评论(0) 推荐(0) 编辑

公告