摘要: 一、Swin 1.基本思想 swin transformer是微软2021年发表的文章,是基于transformer的模型。 主要流程是,首先将图像输入到patch partition中进行分块,然后进行线性变换,这两步可以理解为把图像切了许多小块形成了token,这样就可以输入到后续的tranfo 阅读全文
posted @ 2022-12-23 12:03 我若成风者 阅读(880) 评论(0) 推荐(0) 编辑
摘要: 一、OHEM 1. 目的:区分难分样本 2. 方法:多学习难例 对于一次SGD迭代:先计算出特征图,可读RoI网络对所 有RoI执行前向计算并计算每个RoI的损失,然后选择hard RoIs。把这 些hard RoIs输入到可读可写的RoI网络中执行前向前向计算和反向传播更新网络,并把可读可写的Ro 阅读全文
posted @ 2022-12-23 11:34 我若成风者 阅读(217) 评论(0) 推荐(0) 编辑
摘要: 一、Mask Rcnn 1.基本原理 在Faster Rcnn基础上添加一个Mask预测分支,每个类一张特征图。 大致流程为,首先backbone提取基础特征,然后通过RPN获得proposal,接着通过RoI Align把proposal的feature map裁剪出来,然后接两个分支,一个是类别 阅读全文
posted @ 2022-12-23 11:30 我若成风者 阅读(733) 评论(0) 推荐(0) 编辑