滴滴云RTX2080ti尝鲜,云端游戏卡搞起!

游戏显卡中RTX2080Ti可以说是业界翘楚了,虽然不是专门为深度学习而设计,但是在深度学习上的性能表现也是不错滴。而云端深度学习卡一般都是以Tesla系列为主,虽然号称专业的深度学习卡,但是某些型号也是很渣。
 
 
不知道有没有人想过把2080ti也扔到云端,然后可以按需付费,或者进行月租。肯定有吧,而且现在也有人做了。
 
 
滴滴云正在公测G4云服务(就是2080ti)。之前我做过GPU服务器的比较,滴滴云的性价比是非常高,质量基本也是有保障。很幸运我也拿到了免费测试的机会(真香)。
 
 
下面就分享下在滴滴云的2080ti 跑DeepFaceLab的体验。同时也可以回答下部分群友的问题。具体而完整的安装过程我会在另一篇文章中说明,本文主要就是看看跑DFL性能如何。
测试系统为: Windows Server 2019
测试的DFL版本为:20200315
测试素材:软件自带
 
 
 
登陆系统,安装完驱动后可以通过设备管理器或者GPU-Z或者任务管理器看到看到显卡型号为NVIDIA Ge Force RTX2080Ti,显存11GB
 
 
通过娱乐大师可以看到这台云端电脑的基本配置。其他配置我不关心,我就抓两个核心,显存11G,内存16G。下面就直接跑软件了,分别测试了,提取,模型,合成这几个环节的速度,大家可以对比一下自己的显卡,有2080ti的也可以看看有啥差别。
提取环节:
 
 
 
提取dst 头像的时候花了25分钟,每秒钟只处理了1张图片,这个性能让我陷入深深的怀疑,我怀疑这个阶段主要用的不是GPU而是CPU,否则没有理由2080ti不如我的1070吧?
训练环节。
这个环节没其他的,就是看单次迭代速度。
 
 
训练Quick96模型, 单次迭代时间为94ms
 
 
训练SAEHD模型,默认参数,单次迭代时间为249ms左右
 
 
训练SAEHD模型,结构archi为dfhd,其他默认,单次迭代时间为650ms左右。
 
 
训练SAEHD模型,像素Resolution 为192,其他默认,单次迭代时间为500ms左右。
 
 
 
训练SAEHD模型,像素Resolution 为256 ,bs=4,其他默认,单次迭代时间为600ms左右。
合成环节:
 
 
使用时间5分16秒,每秒处理4.85张图片。
下面以训练环节,做一个简单的横向对比。
 
 
Colab上P100默认参数时的数据,单次迭代299ms。
 
 
1070默认参数下的数据,单次迭代时间449ms。
2080ti 上面已经给出了,单次迭代时间为249ms的样子。
2080ti吊打1070这是必然,快得不是一丁半点。同时2080ti 还略强于P100。K80,P4,P40,T4这些也只能是弟弟了。虽然是游戏卡,但是干起来还是挺猛。
所以不管是云端还是本地,只要钱管够,买2080ti跑换脸还是非常不错的选择。做其他深度学习的研究也不错。如果不想本地烧显卡,占用游戏时间,或者想做一些云端服务搞APP之类,那么搞个云端的最爽了。只需要通过远程桌面连接,操作和本地没啥差别,无论何时何都可以轻松接入。
 
===============
Deepfake中文网 : deepfaker.xyz
个人公众号:托尼是塔克
posted @   托尼不是塔克  阅读(1067)  评论(0编辑  收藏  举报
编辑推荐:
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 一个奇形怪状的面试题:Bean中的CHM要不要加volatile?
· [.NET]调用本地 Deepseek 模型
· 一个费力不讨好的项目,让我损失了近一半的绩效!
阅读排行:
· PowerShell开发游戏 · 打蜜蜂
· 在鹅厂做java开发是什么体验
· 百万级群聊的设计实践
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
· 永远不要相信用户的输入:从 SQL 注入攻防看输入验证的重要性
点击右上角即可分享
微信分享提示