Wang X., He K., Guo C., Weinberger K., Hopcroft H., AT-GAN: A Generative Attack Model for Adversarial Transferring on Generative Adversarial Nets. arXiv preprint, arXiv: 1904.00783, 2019.
概
用GAN生成adversarial samples, 且不需要样本(AdvGAN需要).
主要内容

AT-GAN的训练过程主要分成俩步, 首先, 生成一个普通的条件GAN, 接着在这个条件GAN的基础上训练一个AT-GAN.
符号说明
x: 样本;
y:标签;
Sy: 标签为y为图像;
z:随机噪声;
G(z,y): 生成器;
D:x→R: 判别器;
f(x): 分类器;
Original Generator
首先, 我们需要训练一个普通的条件GAN, 为此, 关于G的损失函数为
LG(z,y)=Ez∼pz(z)H(D(G(z,y)),1)+Ez∼pz(z)H(f(G(z,y)),y),(11)
其中H(a,b)是a和b的熵(应该是指交叉熵吧, 当二分类是就是二分类熵). 显然这个损失就是希望生成器生成的图片既真实, 其标签亦为真实的标签.
关于判别器D的损失则是
LD(x,z,y)=Ex∼pdata(x)H(D(x),1)+Ez∼pz(z)H(D(G(z,y),0).(12)
关于分类器的损失则是
Lf(x,y)=Ex∼pdata(x)H(f(x),y).(13)
注: 三者分别关于G,D,f最小化(虽然作者没有明讲).
Transfer the Generator
假设由上面的算法生成的生成器为Goriginal, 并给定我们希望攻破的分类器ftarget, 我们要构建一个新的分类器Gattack去生成对抗样本. 显然, Gattack需要满足:
- 其生成的样本与真实样本无异, 即
∥Goriginal(z,y)−Gattack(z,y)∥p
足够小;
2. 其生成的图像能够骗过目标分类器ftarget, 最好是存在一个一一映射g, 使得
ftarget(Gattack(z,y))≠y,g(ftarget(Gattack(z,y)))=y.
于是作者构建了俩个损失:
La(z,y)=H(g(ftarget(Gattack(z,y))),y),(15)
Ld(z,y)=∥Gorginal(z,y)+P−Gattack(z,y)∥p,(16)
其中g是我们给定的可逆函数. 显然La的目的是骗过目标分类器, 而Ld的目的是使得生成的样本具有足够的真实性, 另外P是额外加入的高斯噪声, 用于柔化距离(?).
于是训练Gattack就是最小化下式
L(z,y)=αLd(z,y)+βLa(z,y).(17)
注: Gattack的参数初始化为Gorginal.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix