关于传统迁移学习的一点概念
(来源于一位学姐的口述)
- 迁移学习的目标:训练数据集 A 迁移到测试数据集 B,它们的数据分布不一样。
- 方法 1:特征空间的对齐。比如重要性采样,强行让两个分布比较接近。
- 方法 2:把特征分为领域无关、领域相关的部分,把这两部分提取出来。
- 领域就是图片风格之类的东西,一些可能会影响数据分布、但不影响事物本质和分类结果(猫 / 狗)的东西。
- 拿领域无关的部分(比如狗的特征与图片风格无关)做预测;
- 拿领域相关的部分(狗的颜色之类)做数据增强,这种操作被称为增广。
以及,在中文搜索引擎上,搜索“xxx(领域名称)+ 综述”,是很有用的方法。