Incremental Learning Techniques for Semantic Segmentation 论文阅读笔记

Incremental Learning Techniques for Semantic Segmentation 论文阅读笔记

摘要

当需要增量学习新任务时，由于灾难性的遗忘，深度学习架构表现出严重的性能下降。之前增量学习框架专注于图像分类和对象检测，本文正式提出了语义分割的增量学习任务。作者设计了方法提取先前模型的知识以保留有关先前学习的类的信息，同时更新当前模型以学习新的模型。与最近的一些框架相反，本文方法不存储来自先前学习的类的任何图像，并且只需要最后一个模型来保持这些类的高精度。

方法

在输出层进行蒸馏

仅使用该损失函数的模型作为baseline，一个改进是针对模型的Encoder：

即训练时冻结Encoder，只训练Decoder以保持在之前steps中学习到的特征提取能力。上一个step的模型参数也进行冻结，仅用于知识蒸馏。（这里有一个疑问是如果当前这一步一直冻结Encoder，那么Encoder在什么时候训练当前这一步的提取能力呢？等有时间看看代码！）

在中间特征空间进行蒸馏

作者指出在中间特征空间进行蒸馏时不应用交叉熵损失而是应该用L2损失，这是因为这些层并非分类层而仅仅是中间的阶段，参数应该紧靠上一个step的参数。蒸馏项计算如下：

模型 $M_k$ 可以被解耦为编码器 $E_k$ 和解码器，上式中是用编码器的输出计算蒸馏损失。其中 $D_k^{tr}$ 是第k步的数据集。

posted @ 2022-09-08 20:16 脂环阅读(233) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· Incrementer：Transformer for Class-Incremental Semantic Segmentation with Knowledge Distillation Focusing on Old Class论文阅读笔记

· Modeling the Background for Incremental Learning in Semantic Segmentation论文阅读笔记

· 万字长文带你入门增量学习

· 转载：深度学习：蒸馏Distill

· 【人人都能学得会的NLP - 文本分类篇 03】长文本多标签分类分类如何做？

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· 单线程的Redis速度为什么快？
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 展开说说关于C#中ORM框架的用法！