换脸技术 Deepfake Face2Face HeadOn FSGAN
一、换脸技术发展简史
概述:换脸技术的应用分为三类,即换脸/换五官,转换面部表情,转换面部与躯干运动。以下介绍按照时间顺序排列。
1. Face2Face:Real-time Face Capture and Reenactment of RGB Videos(转换面部表情)
由德国纽伦堡大学科学家 Justus Thies 的团队在 CVPR 2016 发布
可以非常逼真的将一个人的面部表情、说话时面部肌肉的变化、嘴型等完美地实时复制到另一个人脸上
论文:http://www.graphics.stanford.edu/~niessner/papers/2016/1facetoface/thies2016face.pdf
2. Deepfake:Face Swapping(换脸 / 换五官)
推出了 FakeApp(适用于Windows)
Github 上有相同的开源项目 FaceSwap(适用于Ubuntu) https://github.com/deepfakes/faceswap
3. HeadOn:Real-time Reenactment of Human Portrait Videos(转换面部表情与躯干运动)
由 Face2Face 原班团队做的升级版,在 ACM Transactions on Graphics 2018 发布
Face2Face 只能实现面部表情的转换,HeadOn 增加了身体运动和头部运动的迁移
论文: http://niessnerlab.org/papers/2018/7headon/headon_preprint.pdf
4. FSGAN:Subject Agnostic Face Swapping and Reenactment (换脸 & 转换面部表情)
ICCV 2019 未开源
论文:https://arxiv.org/pdf/1908.05932.pdf
二、FaceSwap demo
概述:利用 CLM框架与 OpenCV 可实现单张图片换脸,参考 https://blog.csdn.net/wi162yyxq/article/details/53883507 。若要实现视频换脸,需要事先收集大量 A 与 B 各个角度各种表情的人脸图像素材,针对视频帧的不同表情换脸,最后合成影片,但这将耗费宝贵的时间与精力。将换脸工作交给深度 GAN 自主学习可大量节省时间与精力,项目地址:
https://github.com/deepfakes/faceswap
1. 基本条件
Ubuntu16.04
GPU(Nvidia RTX 2070)
Anaconda Python3.6
Tensorflow-gpu
FFMPEG 截取原始影像帧 / 合成换脸后的视频
具体安装方法:https://github.com/deepfakes/faceswap/blob/master/INSTALL.md
2. 过程与结果
a. Extracting Faces
先从video clips里截取帧,再截取人脸,适用于有多段 video clips 素材的情况
$ ffmpeg -i video.mp4 -vf fps=5 "pic_name%04d.png"
video 一般 25frame/second, fps=5 不必截取每一帧
$ python faceswap.py extract -i ~/faceswap/src/frames_folder -o ~/faceswap/faces/extracted_faces
也可直接从一段 video 里截取人脸,适用于一段video(自动截取每一帧)。
$ python faceswap.py extract -i ~/faceswap/src/video.mp4 -o ~/faceswap/faces/extracted_faces
b. Training a model
换脸者A,B双方的训练资料最好 > 3000张
理想 Loss: 0.009-0.01
实际 Loss 0.022, Nvidia RTX 2080 Ti 训练28小时
c. Converting a video
按原始fps截取需要换脸的 video frames
利用训练好的模型转换 video frames
python faceswap.py convert -i ~/faceswap/src/extracted_frames/ -o ~/faceswap/converted/ -m ~/faceswap/A_B_model/
合成转换后的 video frames 至新视频
ffmpeg -f image2 -i converted_frames%04d.png -vcodec libx264 -crf 1 -pix_fmt yuv420p -vf fps=60 A_B.mp4
具体使用方法:https://github.com/deepfakes/faceswap/blob/master/USAGE.md
三、Face2Face demo
https://github.com/datitran/face2face-demo
1. 环境配置与安装
Ubuntu16.04
Anaconda Python3.5
Tensorflow 1.2
OpenCV 3.1.0
Dlib 19.4
OpenCV 3.1.0 安装过程坎坷,试过用 pip,conda 指令安装:
$ pip install opencv-python==3.1.0
$ pip install opencv-contrib-python==3.1.0
$ conda install opencv=3.1.0
虽然都成功安装并通过测试
$ import cv2
$ cv2.__version__
$ 3.1.0
但是在运行 generate_train_data.py 的时候总是在 cv2.destroyallwindows() 这行报错。
最后使用 Cmake-gui 安装成功,方法如下:
a. 不用安装opencv-contrib
b. cuda,python2,doc,example,test 所有选项取消勾选
c. WITH_GTK_2_X 勾选
d. PYTHON3 路径如下:
e. 在 ./opencv-3.1.0/modules/videoio/src/cap_ffmpeg_impl.hpp 里最顶端添加了
#define AV_CODEC_FLAG_GLOBAL_HEADER (1 << 22)
#define CODEC_FLAG_GLOBAL_HEADER AV_CODEC_FLAG_GLOBAL_HEADER
#define AVFMT_RAWPICTURE 0x0020
f. $ make -j8
$ sudo make install
$ sudo ldconfig
成功!!!
2. 过程与结果
a. 训练资料:原始图片与 Landmarks 各400张
b. 训练周期:200 epochs
c. 训练时间:3h with Nvidia RTX 2080Ti
d. 结果:欠拟合
a. 训练资料:原始图片与 Landmarks 各1500张
b. 训练周期:500 epochs
c. 训练时间:15h with Nvidia RTX 2080Ti
d. 结果:过拟合
背景噪声干扰大,不采用。
作者:牛牪犇_9c01
链接:https://www.jianshu.com/p/67eb20c3420e
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。