04 2024 档案

摘要:最近,有一些大型内核卷积网络的研究,但考虑到卷积的平方复杂度,扩大内核会带来大量的参数,继而引发严重的优化问题。受人类视觉的启发,论文提出了外围卷积,通过参数共享将卷积的复杂性从 O(K2) 降低到 O(logK),有效减少 90% 以上的参数数量并设法将内 阅读全文
posted @ 2024-04-24 13:30 晓飞的算法工程笔记 阅读(379) 评论(0) 推荐(0) 编辑
摘要:论文设计了新的CNN-ViT混合神经网络FasterViT,重点关注计算机视觉应用的图像吞吐能力。FasterViT结合CNN的局部特征学习的特性和ViT的全局建模特性,引入分层注意力(HAT)方法在降低计算成本的同时增加窗口间的交互。在包括分类、对象检测和分割各种CV任务上,FasterViT在精 阅读全文
posted @ 2024-04-23 13:28 晓飞的算法工程笔记 阅读(658) 评论(0) 推荐(1) 编辑
摘要:深度学习模型通常堆叠大量结构和功能相同的结构,虽然有效,但会导致参数数量大幅增加,给实际应用带来了挑战。为了缓解这个问题,LORS(低秩残差结构)允许堆叠模块共享大部分参数,每个模块仅需要少量的唯一参数即可匹配甚至超过全量参数的性能。实验结果表明,LORS减少解码器 70% 的参数后仍可达到与原始模 阅读全文
posted @ 2024-04-22 13:19 晓飞的算法工程笔记 阅读(354) 评论(0) 推荐(2) 编辑
摘要:论文重新审视了深度神经网络中的不确定性估计技术,并整合了一套技术以增强其可靠性。论文的研究表明,多种技术(包括模型正则化、分类器改造和优化策略)的综合应用显着提高了图像分类任务中不确定性预测的准确性 来源:晓飞的算法工程笔记 公众号 论文: SURE: SUrvey REcipes for buil 阅读全文
posted @ 2024-04-19 12:07 晓飞的算法工程笔记 阅读(317) 评论(0) 推荐(0) 编辑
摘要:论文提出了一种新的ViT位置编码CPE,基于每个token的局部邻域信息动态地生成对应位置编码。CPE由卷积实现,使得模型融合CNN和Transfomer的优点,不仅可以处理较长的输入序列,也可以在视觉任务中保持理想的平移不变性。从实验结果来看,基于CPE的CPVT比以前的位置编码方法效果更好 来源 阅读全文
posted @ 2024-04-16 13:23 晓飞的算法工程笔记 阅读(1006) 评论(0) 推荐(0) 编辑
摘要:论文基于改进训练配置以及一种新颖的蒸馏方式,提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时,DeiT以卷积网络作为teacher,能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看,效果很不错 来源:晓飞的算法工程笔记 公众号 论文: Tr 阅读全文
posted @ 2024-04-16 13:11 晓飞的算法工程笔记 阅读(359) 评论(0) 推荐(0) 编辑
摘要:论文直接将纯Trasnformer应用于图像识别,是Trasnformer在图像领域正式挑战CNN的开山之作。这种简单的可扩展结构在与大型数据集的预训练相结合时,效果出奇的好。在许多图像分类数据集上都符合或超过了SOTA,同时预训练的成本也相对较低 来源:晓飞的算法工程笔记 公众号 论文: An I 阅读全文
posted @ 2024-04-12 13:19 晓飞的算法工程笔记 阅读(578) 评论(0) 推荐(2) 编辑
摘要:论文认为预测结果能够更准确地区分正负样本,提出结合预测结果IoU和anchor IoU来准确地选择最高质量的预测结果进行网络训练。整体算法简单但十分有效,值得看看 来源:晓飞的算法工程笔记 公众号 论文: Dynamic Label Assignment for Object Detection b 阅读全文
posted @ 2024-04-10 13:31 晓飞的算法工程笔记 阅读(134) 评论(0) 推荐(0) 编辑
摘要:论文提出能够适配硬件加速的动态网络DS-Net,通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略,仅用1/2-1/4的计算量就能达到静态SOTA网络性能,实际加速也有1.62倍 来源:晓飞的算法工程笔记 公众号 论文: Dynamic 阅读全文
posted @ 2024-04-09 13:22 晓飞的算法工程笔记 阅读(439) 评论(0) 推荐(2) 编辑
摘要:论文提出SFR模块,直接重新激活一组浅层特征来提升其在后续层的复用效率,而且整个重激活模式可端到端学习。由于重激活的稀疏性,额外引入的计算量非常小。从实验结果来看,基于SFR模块提出的CondeseNetV2性能还是很不错的,值得学习 来源:晓飞的算法工程笔记 公众号 论文: CondenseNet 阅读全文
posted @ 2024-04-08 14:21 晓飞的算法工程笔记 阅读(245) 评论(0) 推荐(0) 编辑
摘要:论文提出用于out-of-distributions输入检测的energy-based方案,通过非概率的energy score区分in-distribution数据和out-of-distribution数据。不同于softmax置信度,energy score能够对齐输入数据的密度,提升OOD检 阅读全文
posted @ 2024-04-01 12:08 晓飞的算法工程笔记 阅读(194) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示