零样本学习(Zero-shot Learning, ZSL)背景知识
零样本度量学习(Zero-Shot Learning, ZSL)——背景
训练阶段:
-
已知条件
- 训练样本:
, - 训练样本的标签:
, - 所有类别的side information (SI):
,
P.S.,根据我的理解, 和 为一一对应关系。
- 训练样本:
-
前传过程
: 样本进入样本嵌入模型,输出样本嵌入 : SI进入语义嵌入模型,输出语义嵌入
-
计算损失
-
计算score:
,P.S., 这里
可能是需要训练的,也可以是对角矩阵计算欧式距离 -
根据score得到预测标签,再与真实标签对比计算损失
-
-
训练目标
- 样本嵌入模型:
- 语义嵌入模型:
- 以上两个嵌入之间的度量矩阵:
- 样本嵌入模型:
测试阶段
-
已知条件
- 测试样本:
, - 所有测试类别的SI:
- 测试样本:
-
前传过程
-
测试目标:得到预测标签
-
首先计算score
-
然后进行score rank,score最大对应的类别为预测标签
-
性能评价阶段
-
已知条件
- 测试样本的预测标签:
, - 测试样本的真实标签:
, - 评价指标函数:
- 测试样本的预测标签:
-
计算评价指标
区分ZSL 和 Generalized ZSL (GZSL)
给定训练集
- ZSL:
- GZSL:
, testing instance could belong to either seen or unseen categories
常用数据集
- AWA:40类样本(~24700个)训练,10类(~6200个)测试
- CUB:150类样本(~8900个)训练,50类(~2900个)测试
P.S. 以上两个数据集的划分来源于论文ALE
基础的开源项目
一些好的综述 (读过)
- Recent Advances in Zero-Shot Recognition
- Zero-Shot Learning—A Comprehensive Evaluation of the Good, the Bad, and the Ugly
- Knowledge-aware Zero-Shot Learning: Survey and Perspective
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧