05 2022 档案

摘要:1.模型整体架构 左图为论文作者提出了用于视频分类的架构,基于纯transformer的,右图为用不同方式处理时空特征的Encoder的不同组件的变体。 2.视频特征及token构建 2.1 Uniform frame sampling 这种方法就是如图所示,均匀间隔固定的帧,采样帧信息,按照Vit 阅读全文
posted @ 2022-05-09 16:43 梦想是能睡八小时的猪 阅读(1287) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示