小菜

导航

2021年9月22日 #

关于iso文件和img文件的认识

摘要: 这两种格式是有保存存储介质的文件系统的信息(分区表等等),他们不过是存储介质的文件表示(类似一种容器),举例可以这样生成: dd if=/dev/sda of=image.iso。 因此制作U盘的时候可以直接反过来,分区表,引导都填到对应的扇区了。 阅读全文

posted @ 2021-09-22 20:03 penbol 阅读(490) 评论(0) 推荐(0) 编辑

2021年7月12日 #

View Adaptive Neural Networks for High Performance Skeleton-based Human Action Recognition

摘要: 给每一帧(每一个序列)生成一个最佳的相机位置 预处理: 帧级别预处理会丢失信息 序列级预处理对所有帧执行与第一帧相同的操作,对于初始位置和朝向不敏感。定义的身体平面有可能不是很合适。 每一种级别都有两种操作,平移和旋转。 输入默认的预处理是序列级平移,将坐标原点放在第一帧的中心节点上。 坐标转换 上 阅读全文

posted @ 2021-07-12 08:32 penbol 阅读(162) 评论(0) 推荐(0) 编辑

2021年4月3日 #

Temporal Coherence or Temporal Motion Which is More Critical for Video-based Person Re-identification(标红的是我自己一些思考,不过都是瞬时性的想法)

摘要: 主要思想 将视频序列分为时间一致性特征和时间动作特征,且认为时间一致特征对Reid帮助更大。另外随机增加一些时间动作的 噪音,使得网络更多学到一致性特征。 不同于其他视频任务,reid更关注动作的主体,而不是动作。 时间动作线索通常会带来类内噪音例如姿势的改变特别是在聚合阶段。 这里作者个video 阅读全文

posted @ 2021-04-03 16:24 penbol 阅读(179) 评论(0) 推荐(0) 编辑

2021年3月17日 #

Video-based Person Re-identification via 3D Convolutional Networks and Non-local Attention

摘要: 贡献: 3d卷积代替2d卷积 使用non-loca明确l处理不对齐问题(apm通过与相邻帧类似nonlocal 的操作也解决了不对齐)并捕获空时长范围依赖,注意但是没处理遮挡 引言里: 基于视频的识别包括提取特征和融合特征两部分 融合特征包括池化,rnn,以及注意力三种如下图。 这里rnn的缺点是: 阅读全文

posted @ 2021-03-17 11:57 penbol 阅读(266) 评论(0) 推荐(0) 编辑

2021年3月16日 #

Vrstc stcnet

摘要: 这里试着把他的网络改成3d卷积加nolocal看效果会不会更好。 或者把stcnet加到其他网络里看看效果。 主要是用来做数据增强的。 STCnet 明确处理部分遮挡问题,通过空间结构和时间信息两部分来重建。重建部分用的都是autoencode。 最近的办法(2019)通常使用注意力来提取最显著的部 阅读全文

posted @ 2021-03-16 22:02 penbol 阅读(149) 评论(0) 推荐(0) 编辑

2021年3月15日 #

Spatial-Temporal Graph Convolutional Network for Video-based person Re-identification

摘要: 整体结构如下图 考虑了不同patch在所有帧上的关系,以及每一帧上的patch关系(结构) 因为对图还不是很了解(下面先直接总结论文) Patch graph construction 每对节点间的关系 允许我们动态的选择和学习不同patch的关系(这里的patch指的 是把特征图切块并池化后的一个 阅读全文

posted @ 2021-03-15 11:13 penbol 阅读(277) 评论(0) 推荐(0) 编辑

2021年3月14日 #

Dual Attention Matching Network Reid

摘要: 特征序列生成 图片:通过dense net 多通道特征图,然后特征图上一个位置的所有通道作为一个特征,所以多个位置就形成了多个特征序列。 视频:经过densnet,各个帧对应的特征图经过rnn(按帧,也就是按时间步),然后将每一时间步的隐藏状态作为特征序列对。这样的话:第一个时间步的隐藏状态其实就不 阅读全文

posted @ 2021-03-14 16:34 penbol 阅读(111) 评论(0) 推荐(0) 编辑

2021年3月13日 #

Diversity Regularized Spatiotemporal Attention for Video-based Person Re-identification

摘要: 主旨:用空间注意力和时间注意力来解决遮挡和不对齐问题 自动地发现不同部位的注意力(即训练多个注意力模块) 不会受遮挡和不对齐影响(这里是因为时间上的注意力模块会自动择优(权值大的)) 可以这么理解:先在空间维度注意力,然后再在各个部件维度的注意力,所以就不需要考虑对齐和遮挡问题了。 以前基于视频的方 阅读全文

posted @ 2021-03-13 17:32 penbol 阅读(124) 评论(0) 推荐(0) 编辑

2020年12月16日 #

vae

摘要: vae推导 我们试着由编码器去推出一个分布,不再是固定的编码,编码器为$p(z|x)$,解码器为$p(x|z)$。 不同于混合高斯的是,关于隐含变量的混合高斯不容易求,如下式: \[ p(z|x)=\frac{p(x,z)}{p(x)}\\ p(z|x)=\frac{p(x|z)\times p(z 阅读全文

posted @ 2020-12-16 14:59 penbol 阅读(287) 评论(0) 推荐(0) 编辑

2020年10月22日 #

kmeans

摘要: 转https://blog.csdn.net/u013719780/article/details/78413770 阅读全文

posted @ 2020-10-22 15:42 penbol 阅读(98) 评论(0) 推荐(0) 编辑