IJCAI 2023 | 腾讯优图实验室入选论文解读,含小样本学习方法、玻璃物体分割、RSI变化检测研究方向
前言 近日,IJCAI 2023(International Joint Conference on Artificial Intelligence)国际人工智能联合大会公布了录用结果。本届会议共有4566篇投稿,接收率为15%。作为当前全球最负盛名的 AI 学术会议之一,IJCAI将于今年 8月在澳门举行。
本文转载自腾讯优图
仅用于学术分享,若侵权请联系删除
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
【CV技术指南】CV全栈指导班、基础入门班、论文指导班 全面上线!!
01
基于聚类块关联的小样本学习方法
Clustered-patch Element Connection for Few-shot Learning
弱特征表示问题长期以来一直影响着小样本任务的性能。为了缓解这个问题,最近的研究人员通过局部特征块来建立支持和查询实例之间的连接,以生成具有区分性的表示。
然而,我们观察到这些局部特征块之间存在语义不匹配,因为目标对象的位置和大小不固定。这种不匹配会导致不可靠的相似度置信度,而现有方法使用复杂的密集连接会加剧这个问题。基于此,我们提出了一种新颖的聚类块关联(CEC)来纠正不匹配问题。CEC利用块聚类和元素关联操作来分别收集和建立与高相似度特征块的可靠连接。基于CEC层的注意力模块和距离度量,我们提出了一个CECNet小样本分类框架。广泛的实验表明,我们的CECNet在小样本分类任务上优于现有方法。此外,我们的CEC方法还可以扩展到小样本分割和检测任务中,并取得了不错的性能提升。
论文下载地址:
https://arxiv.org/pdf/2304.10093.pdf
02
RFENet:面向互惠特征演化的玻璃分割
RFENet: Towards Reciprocal Feature Evolution for Glass Segmentation
*本文由腾讯优图实验室、上海交通大学共同完成
玻璃状物体在日常生活中非常普遍,但现有的大多数方法仍难以对其进行分割。透明的特性使其难以与背景区分开来,而微小的分离边界则进一步阻碍了对其精确轮廓的获取。
本文通过揭示语义学习和边界学习共同进化的关键需求,提出了选择性相互进化(SME)模块来实现两者之间的相互特征学习。然后,为了利用全局形状上下文,我们提出了一个结构注意细化(SAR)模块,对边界周围的模糊点进行细粒度特征细化。
最后,为了进一步利用多尺度表示,我们将上述两个模块集成到一个级联结构中,然后引入一个互惠特征演化网络(RFENet)以实现有效的玻璃样物体分割。广泛的实验证明,我们的RFENet在三个流行的公共数据集上达到了最先进的性能。
论文下载地址:
https://arxiv.org/pdf/2307.06099.pdf
03
APD:通过对齐-差异-解耦实现更加准确的RSI变化检测
Align, Perturb and Decouple: Toward Better Leverage of Difference Information for RSI Change Detection
*本文由腾讯优图实验室、复旦大学共同完成
传统的遥感图像(RSI)变化检测主要依赖于对图像/特征层面的差分或隐式交互来辅助定位语义变化的区域,这种简单的变化检测方式容易受到非语义噪声的干扰,同时差分信息也缺乏图像内容的先验作为引导;
本文中设计了一套自底向上的操作来解决这些问题,改方案包含三个核心操作--对齐,差异化,解耦:
01 对齐通过RSI在上下文的二阶相似性引导特征融合,从而克服潜在非语义变化带来的干扰;
02 差异化操作将传统的特征差分/特征打乱操作改良为通道维度的随机化差分操作,实现类似dropout的正则化方法,提升差异表征的泛化能力;
03 最后解耦操作将差异表征和图像内容进行解耦,分别进行差异预测,提升变化预测精度;基于以上3点构造的变化检测器相较于基线方法取得了明显提升,在WHU-CD, LEVIR-CD等主流数据集上都取得了最优效果。
论文下载地址:
https://arxiv.org/pdf/2305.18714v1.pdf
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。
【技术文档】《从零搭建pytorch模型教程》122页PDF下载
QQ交流群:470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。
其它文章
比Meta「分割一切AI」更全能!港科大版图像分割AI来了:实现更强粒度和语义功能
Meta Segment Anything会让CV没前途吗?
CVPR'2023年AQTC挑战赛第一名解决方案:以功能-交互为中心的时空视觉语言对齐方法
6万字!30个方向130篇 | CVPR 2023 最全 AIGC 论文汇总
ICCV2023 | 当尺度感知调制遇上Transformer,会碰撞出怎样的火花?
新加坡国立大学提出最新优化器:CAME,大模型训练成本降低近一半!
SegNetr来啦 | 超越UNeXit/U-Net/U-Net++/SegNet,精度更高模型更小的UNet家族
libtorch教程(一)开发环境搭建:VS+libtorch和Qt+libtorch
NeRF与三维重建专栏(三)nerf_pl源码部分解读与colmap、cuda算子使用
NeRF与三维重建专栏(二)NeRF原文解读与体渲染物理模型
BEV专栏(一)从BEVFormer深入探究BEV流程(上篇)
可见光遥感图像目标检测(三)文字场景检测之Arbitrary