【杂项】利用CUDA实现tensorflow的gpu加速——以NXP的eIQ Portal Command line环境为例
这是一个针对于eIQ的解决方案,笔者所用显卡是GTX1650
step1:下载CUDA和CuDnn
2022年3月,eIQ所使用tensorflow版本为2.5.0,因此对应CUDA 11.2.0,CuDnn 8.1.0,CUDA下载完后是一个exe,对CUDA进行安装,具体流程可参考csdn,安装完成后添加环境变量,具体可参考csdn安装教程,十分详尽
step2:打开eIQ Portal
点COMMAND LINE,弹出命令行窗口,输入:
python -m virtualenv venv
venv\Scripts\activate
Python
此时进入脚本编辑界面
import tensorflow
此时很可能会报某个dll缺失,继续
tensorflow.test.gpu_device_name()
可能会出现显卡名字,但是出现几条的dll缺失,以上是官方给出的流程
step3:复制DLL
要解决dll的问题,只需在CUDA的安装目录中的\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin里,找到对应的dll,再复制到System32里,即可解决,测试成功的代码:
import tensorflow as tf
version = tf.__version__
gpu_ok = tf.test.is_gpu_available()
print("tf version:",version,"\nuse GPU",gpu_ok)
gpu_ok返回Ture即可