NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

前言 Segment Anything Model（SAM）首次被应用到了基于增强概念的可解释 AI 上。

本文转载自机器之心

仅用于学术分享，若侵权请联系删除

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

CV各大方向专栏与各个部署框架最全教程整理

【CV技术指南】CV全栈指导班、基础入门班、论文指导班全面上线!!

你是否好奇当一个黑盒深度神经网络 (DNN) 预测下图的时候，图中哪个部分对于输出预测为「击球手」的帮助最大？

香港科技大学团队最新的 NeurIPS2023 研究成果给出了他们的答案。

论文：https://arxiv.org/abs/2305.10289
项目代码：https://github.com/Jerry00917/samshap

继 Meta 的分割一切 (SAM) 后，港科大团队首次借助 SAM 实现了人类可解读的任意 DNN 模型图像概念解释器：Explain Any Concept (EAC)。

你往往会看到传统的 DNN 图像概念解释器会给出这样的解释 (SuperPixel-Based)：

但这类输出通常不能完整地将 DNN 对于输入图像里概念的理解表达给人类。

港科大团队首次将具有强大的概念抓取力的 SAM 和博弈论中夏普利公理 (Shapley Value) 结合起来，构建了端对端具有完整概念的模型解释器，并呈现了非常令人惊叹的结果！！

现在，用户只需要将任意 DNN 接入该解释器的 API，EAC 就可以精准地解释出图中哪些概念影响了模型最终的输出。

算法原理

如下图所示，解释一切 EAC 的算法流程图可大体分为三个阶段：1）SAM 概念抓取，2）利用 Per-Input Equivalence (PIE) 模拟目标 DNN 模型，3）通过计算出 PIE 的夏普利公理值得出近似原目标 DNN 的最终概念解释输出。

夏普利值实现

在博弈论中，夏普利公理的地位举足轻重。基于它，研究人员可以推算出图片里每一个概念对目标模型输出的贡献值，从而得知哪些概念对于模型预测的帮助最大。不过计算夏普利值所需要的时间复杂度为 O (2^N)，这对于几乎任何一个成熟的深度学习模型是灾难性的计算量。

本文为了解决这一问题提出了 Per-Input Equivalence （PIE）轻量型框架。PIE 希望通过一个 surrogate model f' 将原目标 DNN 模型 f 做局部拟合。

PIE 的完整表达式为

这里 f_fc 完全保留了原模型的全连接层，h 是一层线性权重用于模拟 f 的特征提取器，输入 b 为一维 one-hot 对一张目标图片里的概念集 C（由 SAM 生成）的编码。算法通过对 PIE 进行蒙特卡洛估算，就可得出 f^' 对于 f 的近似夏普利值。

文章指出 PIE 的运算十分轻量。在 COCO 标准测试集上，将目标模型设为 ResNet50，平均解释时间仅约为 8.1 秒 / 一张图片。

实验结果

通过给每张测试图逐一添加（Insertion）/ 删除（Deletion）最重要的概念 patch，这两项实验研究者可以直接评估任意解释器在解释目标 DNN 时的表现。

EAC 同时在「添加」和「删除」两项实验中实现了比较优秀的解释效果。

以下是 EAC 效果展示和 baseline 对比：

在文章的最后，团队表示有了 EAC 这项技术，医疗影像，智慧安防等重要的可信机器学习商用应用场景会变的更准确，更可靠。

欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。

计算机视觉入门1v3辅导班

【技术文档】《从零搭建pytorch模型教程》122页PDF下载

QQ交流群：470899183。群内有大佬负责解答大家的日常学习、科研、代码问题。

其它文章

分享一个CV知识库，上千篇文章、专栏，CV所有资料都在这了

明年毕业，还不知道怎么做毕设的请抓紧机会了

LSKA注意力 | 重新思考和设计大卷积核注意力，性能优于ConvNeXt、SWin、RepLKNet以及VAN

CVPR 2023 | TinyMIM：微软亚洲研究院用知识蒸馏改进小型ViT

ICCV2023|涨点神器！目标检测蒸馏学习新方法，浙大、海康威视等提出

ICCV 2023 Oral | 突破性图像融合与分割研究：全时多模态基准与多交互特征学习

听我说，Transformer它就是个支持向量机

HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法

南科大提出ORCTrack | 解决DeepSORT等跟踪方法的遮挡问题，即插即用真的很香

1800亿参数，世界顶级开源大模型Falcon官宣！碾压LLaMA 2，性能直逼GPT-4

SAM-Med2D：打破自然图像与医学图像的领域鸿沟，医疗版 SAM 开源了！

GhostSR|针对图像超分的特征冗余，华为诺亚&北大联合提出GhostSR

Meta推出像素级动作追踪模型，简易版在线可玩 | GitHub 1.4K星

CSUNet | 完美缝合Transformer和CNN，性能达到UNet家族的巅峰！

AI最全资料汇总 | 基础入门、技术前沿、工业应用、部署框架、实战教程学习

计算机视觉入门1v3辅导班

计算机视觉交流群

posted @ 2023-10-25 14:01 CV技术指南（公众号）阅读(42) 评论(0) 编辑收藏举报

刷新页面返回顶部

NeurIPS 2023 | 「解释一切」图像概念解释器来了，港科大团队出品

公告