摘要: motivation: 之前使用flownet的方法有诸多弊端。 1.在检测框架中加入光流网络极大地增加了检测器模型的参数,无法用在移动端。 2.光流原本是描述两张图片间像素点的位移的,直接将其用在high-level的feature map上会引入人为的干扰。特别的,high-level的feat 阅读全文
posted @ 2019-04-14 11:51 Gaaray 阅读(1278) 评论(0) 推荐(0) 编辑
摘要: motivation: 作者发现对图片进行降采样有时能有助于检测精度的提升。具体来说,图片降采样能带来两方面的提升: 1)减少false positive(fp)的数量,过多地关注图片上不必要的细节会引入false positive。 2)增加true positive(tp)的数量,通过对图片进行 阅读全文
posted @ 2019-04-11 12:16 Gaaray 阅读(459) 评论(0) 推荐(0) 编辑
摘要: 文章链接:https://arxiv.org/abs/1904.01784v1 简介 受人类视觉注意力系统的启发,文章提出了一个叫Patchwork的模型,利用了记忆和注意力之间的微妙的相互作用来进行高效的视频处理。 图1:a) 视频流中的每个时间步,我们的方法仅仅处理当前帧的一个小的局部窗,但由于 阅读全文
posted @ 2019-04-10 11:28 Gaaray 阅读(1024) 评论(0) 推荐(0) 编辑
摘要: 参考:https://mp.weixin.qq.com/s/Sq3dBuU8aY3Ug9NBZMc5lA Motivation 物体在快速运动时,当人眼所看到的影像消失后,人眼仍能继续保留其影像,约0.1-0.4秒左右的图像,这种现象被称为视觉暂留现象。人类在观看视频时,利用视觉暂留机制和记忆能力, 阅读全文
posted @ 2019-04-08 16:35 Gaaray 阅读(1387) 评论(0) 推荐(0) 编辑
摘要: motivation: 近来以桌面版GPU为计算平台的视频目标检测取得了较多成果,如DFF,FGFA等,但这些算法没法用在移动端,移动端的计算资源有限不足以运行这些算法。 本文提出了一个用于移动端的轻量化视频目标检测网络。在稀疏关键帧上运行轻量化的图片目标检测器,使用了一个非常小的轻光流网络来提取光 阅读全文
posted @ 2019-04-08 11:23 Gaaray 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 大雁与飞机 假设现在有这样一个测试集,测试集中的图片只由大雁和飞机两种图片组成,如下图所示: 假设你的分类系统最终的目的是:能取出测试集中所有飞机的图片,而不是大雁的图片。 现在做如下的定义: True positives : 飞机的图片被正确的识别成了飞机。 True negatives: 大雁的 阅读全文
posted @ 2019-03-31 16:29 Gaaray 阅读(7035) 评论(3) 推荐(2) 编辑
摘要: 来自清华的一篇文章,发表在ECCV2018上,是对FGFA做的改进。 针对R-FCN这一目标检测算法做出的专有改进,目前看来这个方法只适合用在R-FCN,无法迁移到其他目标检测算法,如faster rcnn、SSD等。 具体的做法是这样的,FGFA就是图中左半部分,分别提取相邻帧的图片特征,并用光流 阅读全文
posted @ 2019-03-24 16:36 Gaaray 阅读(639) 评论(0) 推荐(0) 编辑
摘要: 发表在ECCV2018上,提出一种用可变形卷积做特征对齐的方法。 与FGFA十分相似,思想都是单帧不够,多帧来凑,利用相邻帧的特征来对当前帧进行增强,以此来达到更好的检测效果。不同点在于FGFA是利用光流来对两张图片的特征进行对齐, 这篇文章采用的是可变形卷积来做特征对齐。 首先将当前帧和相邻帧经过 阅读全文
posted @ 2019-03-24 16:27 Gaaray 阅读(984) 评论(0) 推荐(0) 编辑
摘要: 来自MSRA视觉计算组,发表在CVPR2018上,对DFF和FGFA的改进。 motivation 在DFF和FGFA的基础上提出三个改进 对速度和精度进行权衡 在DFF和FGFA的基础上提出三个改进 对速度和精度进行权衡 DFF和FGFA分别专注于提高速度和精度,这篇文章尝试把两者的优势结合起来, 阅读全文
posted @ 2019-03-24 16:05 Gaaray 阅读(591) 评论(0) 推荐(0) 编辑
摘要: 来自MSRA视觉计算组,发表在ICCV2017上,提出了一个通过特征聚合来增强特征的方法。 motivation 视频中的退化现象很严重 通过聚合多帧的特征来对每一帧特征进行增强 用光流传播特征 视频中的退化现象很严重 通过聚合多帧的特征来对每一帧特征进行增强 用光流传播特征 视频目标检测中,存在图 阅读全文
posted @ 2019-03-24 15:37 Gaaray 阅读(790) 评论(0) 推荐(0) 编辑