小菜

导航

03 2021 档案

Video-based Person Re-identification via 3D Convolutional Networks and Non-local Attention
摘要:贡献: 3d卷积代替2d卷积 使用non-loca明确l处理不对齐问题(apm通过与相邻帧类似nonlocal 的操作也解决了不对齐)并捕获空时长范围依赖,注意但是没处理遮挡 引言里: 基于视频的识别包括提取特征和融合特征两部分 融合特征包括池化,rnn,以及注意力三种如下图。 这里rnn的缺点是: 阅读全文

posted @ 2021-03-17 11:57 penbol 阅读(310) 评论(0) 推荐(0)

Vrstc stcnet
摘要:这里试着把他的网络改成3d卷积加nolocal看效果会不会更好。 或者把stcnet加到其他网络里看看效果。 主要是用来做数据增强的。 STCnet 明确处理部分遮挡问题,通过空间结构和时间信息两部分来重建。重建部分用的都是autoencode。 最近的办法(2019)通常使用注意力来提取最显著的部 阅读全文

posted @ 2021-03-16 22:02 penbol 阅读(185) 评论(0) 推荐(0)

Spatial-Temporal Graph Convolutional Network for Video-based person Re-identification
摘要:整体结构如下图 考虑了不同patch在所有帧上的关系,以及每一帧上的patch关系(结构) 因为对图还不是很了解(下面先直接总结论文) Patch graph construction 每对节点间的关系 允许我们动态的选择和学习不同patch的关系(这里的patch指的 是把特征图切块并池化后的一个 阅读全文

posted @ 2021-03-15 11:13 penbol 阅读(322) 评论(0) 推荐(0)

Dual Attention Matching Network Reid
摘要:特征序列生成 图片:通过dense net 多通道特征图,然后特征图上一个位置的所有通道作为一个特征,所以多个位置就形成了多个特征序列。 视频:经过densnet,各个帧对应的特征图经过rnn(按帧,也就是按时间步),然后将每一时间步的隐藏状态作为特征序列对。这样的话:第一个时间步的隐藏状态其实就不 阅读全文

posted @ 2021-03-14 16:34 penbol 阅读(130) 评论(0) 推荐(0)

Diversity Regularized Spatiotemporal Attention for Video-based Person Re-identification
摘要:主旨:用空间注意力和时间注意力来解决遮挡和不对齐问题 自动地发现不同部位的注意力(即训练多个注意力模块) 不会受遮挡和不对齐影响(这里是因为时间上的注意力模块会自动择优(权值大的)) 可以这么理解:先在空间维度注意力,然后再在各个部件维度的注意力,所以就不需要考虑对齐和遮挡问题了。 以前基于视频的方 阅读全文

posted @ 2021-03-13 17:32 penbol 阅读(159) 评论(0) 推荐(0)