L2M-GAN: Learning to Manipulate Latent Space Semantics for Facial Attribute Editing阅读笔记
L2M-GAN: Learning to Manipulate Latent Space Semantics for Facial Attribute Editing
2021 CVPR L2M-GAN: Learning To Manipulate Latent Space Semantics for Facial Attribute Editing (thecvf.com)
(个人理解,欢迎指正错误)
Introduction
本文是一篇面部属性编辑的文章,虽然与人脸匿名是两个角度,但是任务是相通的。

面部属性编辑有两点要求:1、目标属性特征应当正确出现在编辑后的人脸上;2、任何不相关的面部特征均不应当在编辑后被修改。针对以上两点要求,面部属性编辑的解决方案有两类:1、空间感知;2、潜在空间的因子分解。空间感知假设被编辑特征有良好的局部性,但对于诸如性别、年龄等全局特征效果不好。潜在空间的因子分解旨在探索一个已经训练好的GAN模型的潜在空间,将其分解为与不同属性相关的部分。但这种策略不是端到端的训练,容易陷入局部最优解。 文章的L2M-GAN以一种端到端的方式实现了对潜在空间的任意特征的正交化拆解。
Methodology
文中并未提过网络细节,源代码也未公开训练代码,通过前项传播的evaluate过程汇总出如下网络细节,仅供参考。
PersonalOpinions
本文的特征解耦网络style transformer结构简单直观,用正交作损失进行优化,效果良好。人脸中的特征相互关联,尤其是一些全局特征,如年龄,身份,性别等无法通过空间感知进行特征分割,L2M-GAN为复杂全局特征的分割提供了一条可行路径,实现了编辑目标属性特征的同时,任何不相关的特征均不应当被明显修改。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库