【五期邹昱夫】CCF-A(CCS)Membership Inference Attacks by Exploiting Loss Trajectory
本文设计了一种基于损失轨迹的成员推理攻击方法,该方法严格遵守了Membership inference attacks from first principles这篇论文的评估标准,保证高正确率的同时拥有低误报率。攻击者首先对目标模型进行标准模型蒸馏,得到蒸馏后的模型。 通过这样做,攻击者可以完全控制蒸馏过程,并可以在不同的时间保存蒸馏出的目标模型。 经过蒸馏后,攻击者可以在所有的中间蒸馏模型上对任意给定的目标样本进行评估,得到其损失轨迹,称之为蒸馏损失轨迹。 最后,攻击模型将该损失轨迹与原目标模型得到的损失作为输入,进行成员推理。"Liu, Yiyong, et al. "Membership inference attacks by exploiting loss trajectory." Proceedings of the 2022 ACM SIGSAC Conference on Computer and Communications Security. 2022."
本文的优点在于攻击做到了在0.1%的低假阳性率下获得了比现有方法至少高6×的真阳性率。找到了成员推理攻击新的角度。
本文的缺点在于对使用的知识蒸馏方法没有进行具体说明。
2023年2月24日