零样本学习(Zero-shot Learning, ZSL)背景知识

零样本度量学习(Zero-Shot Learning, ZSL)——背景

训练阶段:

  • 已知条件

    • 训练样本:X={xi|i=1,,N}
    • 训练样本的标签:Y={yi|i=1,,C}
    • 所有类别的side information (SI):S={sc|c=1,,C},
      P.S.,根据我的理解,YS为一一对应关系。
  • 前传过程

    • xiDxfi: 样本进入样本嵌入模型,输出样本嵌入
    • SDsFs: SI进入语义嵌入模型,输出语义嵌入
  • 计算损失

    • 计算score:

      Oi=(fi)TWFsRC×1

      P.S., 这里W可能是需要训练的,也可以是对角矩阵计算欧式距离

    • 根据score得到预测标签,再与真实标签对比计算损失

  • 训练目标

    • 样本嵌入模型:Dx
    • 语义嵌入模型:Ds
    • 以上两个嵌入之间的度量矩阵:W

测试阶段

  • 已知条件

    • 测试样本:X^,
    • 所有测试类别的SI: S^={s^c|c=1,,C^}
  • 前传过程

    • xi^Dxfi^
    • S^DsFs^
  • 测试目标:得到预测标签 Yp

    • 首先计算score
      O^i=(fi)^TWFs^RC^×1

    • 然后进行score rank,score最大对应的类别为预测标签

性能评价阶段

  • 已知条件

    • 测试样本的预测标签:Yp
    • 测试样本的真实标签:Y^
    • 评价指标函数:M(,)
  • 计算评价指标

    • M(Yp,Y^)

区分ZSL 和 Generalized ZSL (GZSL)

给定训练集 T=(xX,yY), 测试集 E=(x^X^,y^Y^)

  • ZSL: YY^=
  • GZSL: YY^, testing instance could belong to either seen or unseen categories

常用数据集

  • AWA:40类样本(~24700个)训练,10类(~6200个)测试
  • CUB:150类样本(~8900个)训练,50类(~2900个)测试
    P.S. 以上两个数据集的划分来源于论文ALE

基础的开源项目

一些好的综述 (读过)

  • Recent Advances in Zero-Shot Recognition
  • Zero-Shot Learning—A Comprehensive Evaluation of the Good, the Bad, and the Ugly
  • Knowledge-aware Zero-Shot Learning: Survey and Perspective
posted @   徐嘻嘻xixi  阅读(199)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
点击右上角即可分享
微信分享提示