晓飞的算法工程笔记

2024年8月26日

EXITS：基于极值点低标注成本弱监督实例分割 | CVPR 2024

摘要： EXITS将极值点视为真实实例掩模的一部分并将它们传播以识别潜在前景和背景点，所有这些都用于训练伪标签生成器，然后由生成器给出的伪标签反过来用于最终模型的监督学习。来源：晓飞的算法工程笔记公众号论文: Extreme Point Supervised Instance Segmentation 阅读全文

posted @ 2024-08-26 13:26 晓飞的算法工程笔记阅读(12) 评论(0) 推荐(0) 编辑

Swahili-text：华中大推出非洲语言场景文本检测和识别数据集 | ICDAR 2024

摘要：论文提出了一个专门针对斯瓦希里语自然场景文本检测和识别的数据集，这在当前研究中是一个未充分开发的语言领域。数据集包括976张带标注的场景图像，可用于文本检测，以及8284张裁剪后的图像用于识别。来源：晓飞的算法工程笔记公众号论文: The First Swahili Language Scen 阅读全文

posted @ 2024-08-26 13:19 晓飞的算法工程笔记阅读(199) 评论(0) 推荐(1) 编辑

2024年8月22日

DLAFormer：微软提出多任务统一的端到端文本分析Transformer模型 | ICDAR 2024

摘要：论文提出新颖的基于Transformer的端到端方法DLAFormer，在统一的模型中集成多个文档布局分析任务，包括图形页面对象检测、文本区域检测、逻辑角色分类和阅读顺序预测。为了实现这一目标，将各种DLA子任务视为关系预测问题并提出了统一标签空间方法，使得统一关系预测模块能够有效而高效地同时处理这阅读全文

posted @ 2024-08-22 09:46 晓飞的算法工程笔记阅读(21) 评论(0) 推荐(0) 编辑

SLAB：华为开源，通过线性注意力和PRepBN提升Transformer效率 | ICML 2024

摘要：论文提出了包括渐进重参数化批归一化和简化线性注意力在内的新策略，以获取高效的Transformer架构。在训练过程中逐步将LayerNorm替换为重参数化批归一化，以实现无损准确率，同时在推理阶段利用BatchNorm的高效优势。此外，论文设计了一种简化的线性注意力机制，其在计算成本较低的情况下达到阅读全文

posted @ 2024-08-22 09:40 晓飞的算法工程笔记阅读(96) 评论(0) 推荐(0) 编辑

2024年8月20日

BVS：多强联手，李飞飞也参与的超强仿真数据生成工具，再掀数据狂潮 | CVPR 2024

摘要： BEHAVIOR Vision Suite（BVS）是一个新型工具包，旨在系统评估和全面理解计算机视觉模型。研究人员能够在场景、对象和相机级别控制各种参数，有助于创建高度定制的数据集。来源：晓飞的算法工程笔记公众号论文: BEHAVIOR Vision Suite: Customizable 阅读全文

posted @ 2024-08-20 09:50 晓飞的算法工程笔记阅读(24) 评论(0) 推荐(0) 编辑

DMS：直接可微的网络搜索方法，最快仅需单卡10分钟 | ICML 2024

摘要： Differentiable Model Scaling（DMS）以直接、完全可微的方式对宽度和深度进行建模，是一种高效且多功能的模型缩放方法。与先前的NAS方法相比具有三个优点：1）DMS在搜索方面效率高，易于使用。2）DMS实现了高性能，可与SOTA NAS方法相媲美。3）DMS是通用的，与各种阅读全文

posted @ 2024-08-20 09:40 晓飞的算法工程笔记阅读(96) 评论(0) 推荐(0) 编辑

2024年8月19日

EfficientMod：微软出品，高效调制主干网络 | ICLR 2024

摘要： Efficient Modulation (EfficientMod) 融合了卷积和注意力机制的有利特性，同时提取空间上下文并对输入特征进行投影，然后使用简单的逐元素乘法将其融合在一起。EfficientMod的设计保证了高效性，而固有的调制设计理念则保证了其强大的表示能力来源：晓飞的算法工程笔记阅读全文

posted @ 2024-08-19 09:46 晓飞的算法工程笔记阅读(19) 评论(0) 推荐(0) 编辑

RealNet：从数据生成到模型训练的最新工业异常检测 | CVPR 2024

摘要：论文提出了一种创新的自监督异常检测框架RealNet，集成了三个核心组件：可控制强度的扩散异常合成（SDAS）、异常感知特征选择（AFS）和重构残差选择（RRS）。这些组件通过协同作用，使RealNet能够有效地利用大规模预训练模型来进行异常检测，同时保持计算开销在合理的低范围内。RealNet为未阅读全文

posted @ 2024-08-19 09:35 晓飞的算法工程笔记阅读(220) 评论(0) 推荐(0) 编辑

2024年8月16日

Efficient DETR：别再随机初始化了，旷视提出单解码层的高效DETR | CVPR 2021

摘要： Efficient DETR结合密集检测和稀疏集合检测的优点，利用密集先验来初始化对象容器，弥补单层解码器结构与 6 层解码器结构的差距。在MS COCO上进行的实验表明，仅 3 个编码器层和 1 个解码器层即可实现与最先进的目标检测方法竞争的性能，在CrowdHuman密集数据集上的性能也远远优于阅读全文

posted @ 2024-08-16 09:39 晓飞的算法工程笔记阅读(20) 评论(0) 推荐(0) 编辑

SMCA：港中文提出注意力图校准的DETR加速方案 | ICCV 2021

摘要：为了加速DETR收敛，论文提出了简单而有效的Spatially Modulated Co-Attention（SMCA）机制，通过在初始边界框位置给予较高的协同注意力响应值的约束来构建DETR的回归感知协同注意力。此外，将SMCA扩展为多头注意力和尺度选择注意力后，对比DETR可以实现更好的性能（1 阅读全文

posted @ 2024-08-16 09:28 晓飞的算法工程笔记阅读(124) 评论(0) 推荐(0) 编辑

晓飞的算法工程笔记

公告