随笔分类 - 3_1 经典论文解析
摘要:FCOS FCOS网络解析 FPN输出多个特征图,然后如何处理这些特征图? 【问题】“特征图相对原图的步距是s”是个什么东西
阅读全文
摘要:视频链接 FPN:越高层次的特征图用于检测更大的目标,图下就是FPN的结构简图: 下图是up主画的详图: Upsample使用的是邻近插值算法。【应该也可以使用别的插值算法】 【问题】为什么是从上层往下进行融合,为什么不从下层往上层。或者从中间层往两边,或者其他的。 FPN用在Faster R-CN
阅读全文
摘要:卷积神经网络基础补充——梯度下降 卷积神经网络基础 VGG网络详解及感受野的计算 感受野、padding、stride 感受野:特征图上一个像素点对应于原图中的区域有多大。举例:假设输入图片大小WxW、Filter大小FxF、步长S、padding的像素数P,则经卷积后的矩阵尺寸大小计算公式为:N=
阅读全文
摘要:1.RepVGG 参考: RepVGG网络简介 BN详解 RepVGG在训练和推理的时候采用不同的网络结构,从而加速网络的推理速度。RepVGG的主要内容是在推理阶段执行Structural re-parameterization,即图A所示,将多分支结构转换为一个3x3的卷积,具体如下: 图A解释
阅读全文
摘要:# BN 假设一个batch中有两张图片,则两张图片输入网络后得到两个feature,分别为feature1和feature2: ,它们是two-stage的,需要先使用启发式方法(selective search)或者CNN网络(RPN)产生Region Proposal,然后再
阅读全文
摘要:Transformer:https://blog.csdn.net/qq_37541097/article/details/117691873,总结: Self-Attention:输入n个向量,每个向量得到一组(q,k,v),通过Attention(Q, K,V)将不同向量的(q,k,v)进行相互
阅读全文
摘要:请直接参考:Neural Turing Machine(NTM) - 神经图灵机,本文只是进行补充 补充与总结: 向量 中的每个元素代表各个记忆与输入的相关程度。 定位机制(Addressing Mechanism)就是用于生成 pytorch实现的NTM:https://gith
阅读全文