随笔分类 -  video detection

摘要:Motivation: 阈值分割的阈值并没有通过模型训练学出来,而是凭借主观经验设置,本文通过与背景得分比较提取对应的proposal,不用阈值的另一篇文章是Shou Zheng的AutoLoc,通过伪标签训练回归网络 阈值分割缺点:低阈值会把多个动作实例ground-truth合并成一个动作实例, 阅读全文
posted @ 2019-12-19 16:37 demianzhang 阅读(534) 评论(0) 推荐(0)
摘要:研究内容:弱监督时域动作定位 结果:Thumos14 mAP0.5 = 27.0 ActivityNet1.3 mAP0.5 = 34.5 从结果可以看出弱监督这种瞎猜的方式可以PK掉早些时候的一些全监督方法 Code: GitHub P.S.我在机器上复现始终差一点点 Motivation: 发现 阅读全文
posted @ 2019-12-17 02:50 demianzhang 阅读(1600) 评论(6) 推荐(0)
摘要:本文将Faster-RCNN用在了I3D的feature map上,用于视频中多人多动作的检测 challege比赛第二名的整体方法是将Faster-RCNN作用在I3Dfeature上。训练时,以标注的关键帧为中心采样64帧(clip)过I3D,取feature中的关键帧feature过rpn网络 阅读全文
posted @ 2018-10-24 21:06 demianzhang 阅读(737) 评论(0) 推荐(0)
摘要:Action Recognition: 行为识别,视频分类,数据集为剪辑过的动作视频 Temporal Action Detection: 从未剪辑的视频,定位动作发生的区间,起始帧和终止帧并预测类别 难点 1: 边界不明确(助跑跳远,上篮,高尔夫挥杆) 2: 如何利用时序信息 3: 时序跨度大(A 阅读全文
posted @ 2018-10-10 19:40 demianzhang 阅读(2007) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2018-10-03 18:45 demianzhang 阅读(2) 评论(0) 推荐(0)
摘要:Motivation 实现快速和准确地抽取出视频中的语义片段 Proposed Method -提出了TURN模型预测proposal并用temporal coordinate regression来校正proposal的边界 -通过复用unit feature来实现快速计算 主要步骤如下: Vid 阅读全文
posted @ 2018-09-28 20:07 demianzhang 阅读(1736) 评论(0) 推荐(0)
摘要:互补时域动作提名生成 这里的互补是指actionness score grouping 和 sliding window ranking这两种方法提proposal的结合,这两种方法各有利弊,形成互补。 滑窗均匀覆盖所有的视频片段,但时域边界不准确,聚合方法可能更准确但当actionness sco 阅读全文
posted @ 2018-09-28 12:06 demianzhang 阅读(1907) 评论(0) 推荐(0)
摘要:先介绍YOLO[转]: 第一个颠覆ross的RCNN系列,提出region-free,把检测任务直接转换为回归来做,第一次做到精度可以,且实时性很好。 1. 直接将原图划分为SxS个grid cell,如果有物体的中心落到这个格子里那么这个格子的gt就是这个物体。 2. 每个格子被指定的gt需要对应 阅读全文
posted @ 2018-07-02 02:42 demianzhang 阅读(8308) 评论(0) 推荐(0)