摘要:
一般图像匹配步骤:提取关键点、提取描述子、最近邻匹配、外点滤除、求解几何约束。其中外点滤除可用最优次优比限制、Ransac等。 一、Superpoint 1.基本原理 Superpoint是2018年的、基于CNN的、自监督的、用于同时提取图像关键点和描述子的网络模型。 基本思想是,首先将图像输入到 阅读全文
摘要:
一、SETR 1.基本原理 SETR是2021年复旦和腾讯优图联合提出的一个基于ViT的新型架构的语义分割模型,其仍然是语义分割常用的Encoder-Decoder架构,核心思想是用Transformer替代CNN做Encoder。 主要步骤为首先把图像切分为固定大小的块,然后经过线性变换且加入切块 阅读全文
摘要:
def get_group_from_pair(pair_list): """ 功能:根据成对的关系,获得group 输入:对关系list,如[[1, 3], [2, 3], [4, 5], [3, 6], [6, 8]] 输出:组关系list,如[[1, 2, 3, 6, 8], [4, 5]] 阅读全文
摘要:
一、Swin 1.基本思想 swin transformer是微软2021年发表的文章,是基于transformer的模型。 主要流程是,首先将图像输入到patch partition中进行分块,然后进行线性变换,这两步可以理解为把图像切了许多小块形成了token,这样就可以输入到后续的tranfo 阅读全文
摘要:
一、OHEM 1. 目的:区分难分样本 2. 方法:多学习难例 对于一次SGD迭代:先计算出特征图,可读RoI网络对所 有RoI执行前向计算并计算每个RoI的损失,然后选择hard RoIs。把这 些hard RoIs输入到可读可写的RoI网络中执行前向前向计算和反向传播更新网络,并把可读可写的Ro 阅读全文
摘要:
一、Mask Rcnn 1.基本原理 在Faster Rcnn基础上添加一个Mask预测分支,每个类一张特征图。 大致流程为,首先backbone提取基础特征,然后通过RPN获得proposal,接着通过RoI Align把proposal的feature map裁剪出来,然后接两个分支,一个是类别 阅读全文
摘要:
一、用pytorch实现lenet类似网络的训练 1.网络结构 2.代码 from torch import nn, optim import torch.nn.functional as F import torchvision import torchvision.transforms as t 阅读全文
摘要:
导读: 由于mask2former是在transformer发展较久才出来的,学习mask2former之前有一些方法的依赖(如mask2former是在maskformer上进行的改进,而maskformer又有detr的影子等),因此在本次整理中附加了一些相关方法/概念,以便更好地理解mask2 阅读全文
摘要:
一、基本原理 形态学操作的目的是为了提取图像中主要的分量信息。包括腐蚀、膨胀、开运算、闭运算、梯度运算、顶帽运算、黑帽运算等。 二、几种运算 1.腐蚀 能够将图像的边界点消除,使图像沿着边界向内收缩,也可以将小于指定结构体元素的部分去除。 2.膨胀 能够对图像的边界进行扩张。将背景中与前景对象接触到 阅读全文
摘要:
一、需求 将一段曲线进行平滑,使得曲线光滑并保持原来的基本形状。 二、方法及原理 对X/Y两个纬度分别进行平滑,再堆叠成新的点串。 平滑用Savitzky-Golay滤波,是一种数字滤波器,可以在不改变信号趋势的情况下提高数字的精度。核心思想是,对一定长度窗口内的数据点进行K阶多项式拟合。可以理解为 阅读全文