Lhiker - 博客园

2022年6月14日

Adversarial seeded sequence growing for weakly-supervised temporal action localization概述

摘要： 0.前言相关资料：论文 github 论文解读论文基本信息：领域：弱监督时序动作定位综述更新时间：ACM MM2019（2019.8.7） 1.针对的问题大多数现有的框架依赖于类激活序列(CAS)，通过最小化视频级的分类损失来定位动作，它利用了动作中最具判别性的部分，但忽略了次要区域，具阅读全文

posted @ 2022-06-14 16:03 Lhiker 阅读(94) 评论(0) 推荐(0)

Two-Stream Consensus Network for Weakly-Supervised Temporal Action Localization概述

摘要： 1.针对的问题在没有帧级注释的情况下，W-TAL方法很难识别假阳性的动作建议，并生成具有精确时间边界的动作建议。具体来说，之前的W-TAL方法所面临的最关键的问题之一是缺乏排除假阳性动作建议的能力。如果没有帧级注释，它们会定位不一定与视频级标签对应的动作示例。例如，模型可能仅通过检查场景中是否存在阅读全文

posted @ 2022-06-14 11:11 Lhiker 阅读(103) 评论(0) 推荐(0)

2022年5月26日

mixup: BEYOND EMPIRICAL RISK MINIMIZATION概述

摘要：参考简书，github 0.前言相关资料： arxiv github 论文解读论文基本信息：领域：数据增强发表时间：arxiv 2022（2022.5.1） 1.针对的问题大型的深度神经网络存在一些不好的行为，比如记忆性和对抗样本敏感问题。当前的神经网络大多都是基于经验风险最小化（ERM原阅读全文

posted @ 2022-05-26 20:20 Lhiker 阅读(301) 评论(0) 推荐(0)

2022年5月20日

I3D论文总结

摘要：最近看了李沐讲论文系列朱毅老师讲的I3D论文精读（视频，笔记），这里记录一下。 1.针对的问题 1.之前的视频数据集都太小，导致大多数流行的动作识别基准都很小，且即使不同模型效果有好有坏也难以区分。 2.在I3D提出之前，视频一直没有明确的前端运行架构，之前捕获时序信息的方法主要有三种。1.向模型中阅读全文

posted @ 2022-05-20 16:42 Lhiker 阅读(1362) 评论(0) 推荐(0)

2022年5月16日

ACM-Net: Action Context Modeling Network for Weakly-Supervised Temporal Action Localization概述

摘要： 1.针对的问题传统的方法主要侧重于前景和背景帧的分离，只有单一的注意力分支和类激活序列。然而，作者认为，除了独特的前景和背景帧外，还有大量语义模糊的动作语境帧。将这些上下文帧分组到同一个背景类是没有意义的，因为它们在语义上与特定的动作类别相关。 2.主要贡献 •与之前将视频帧仅划分为前景帧和背景帧阅读全文

posted @ 2022-05-16 20:32 Lhiker 阅读(293) 评论(0) 推荐(0)

2022年5月3日

代码随笔

摘要： 1.torch.where(condition，x，y) 有两种情况： 1.包含三个参数，如果condition为true，则 value值为x; 如果condition为false，则 value值为y; 2.若只包含condition参数，若进行判断的是一个n维张量，则返回一个元组，包括n个te 阅读全文

posted @ 2022-05-03 15:14 Lhiker 阅读(374) 评论(0) 推荐(0)

2022年4月25日

Action Graphs: Weakly-supervised Action Localization with Graph Convolution Networks总结

摘要： 1.针对的问题在弱监督动作定位领域，这篇论文之前的方法没有明确利用视频片段之间的相似性来进行定位和分类预测，但是作者认为，在没有帧级标注的情况下，弱监督系统必须依赖视频时序段之间的相似性提示。具体来说，必须（1）利用不同动作类别的前景片段之间的差异来正确分类视频；（2）使用相同动作的前景片段之间阅读全文

posted @ 2022-04-25 15:54 Lhiker 阅读(116) 评论(0) 推荐(0)

2022年4月24日

图神经网络总结

摘要：看了李沐老师在B站讲的零基础多图详解图神经网络（视频），博客地址，这里稍微总结一下。图神经网络部分有点复杂，建议感兴趣的同学看一下视频或者博客 1.什么是图图是表示一些实体之间的一些关系，实体为顶点，关系为边，图上面可以有三种问题：1.图的分类，如分出包括两个环的图。2.顶点分类，如在一张关系图中阅读全文

posted @ 2022-04-24 13:17 Lhiker 阅读(198) 评论(0) 推荐(0)

2022年4月20日

Weakly Supervised Action Localization by Sparse Temporal Pooling Network总结

摘要： 0.前言相关资料： arxiv code 论文翻译（翻译1，翻译2）论文基本信息：领域：弱监督时序动作定位发表时间：CVPR2018（2018.4.3） 1.针对的问题这篇论文前的许多视频理解技术都依赖于修剪过的视频作为输入，然而，现实世界中的大多数视频都是未修剪的，包含大量与目标动作无关阅读全文

posted @ 2022-04-20 10:15 Lhiker 阅读(101) 评论(0) 推荐(0)

2022年4月13日

Action Shuffling for Weakly Supervised Temporal Localization概述

摘要： 1.针对的问题目前的弱监督动作定位方法表现出两个显著的趋势：（1）动作背景建模。通过分别学习视频级别的动作和视频的背景表示，可以提高动作定位性能，然而，视频级建模只能捕获粗粒度的描述。对动作的内在特征进行深入分析的研究较少。（2）探索外部资源。为了弥补弱监督带来的有限信息，借助外部资源已成阅读全文

posted @ 2022-04-13 20:22 Lhiker 阅读(107) 评论(0) 推荐(0)

自由方向

公告