关于zed使用深度学习报错`CUDNN_STATUS_EXECUTION_FAILED. `问题
关于zed使用深度学习报错CUDNN_STATUS_EXECUTION_FAILED.
问题
问题由来
我们在使用zed相机的时候试图调用zed自带的api接口来取视频流,以此来实现下一步的神经网络推理,从而实现目标检测与跟踪,在代码写好后我们使用CPU对于目标检测进行推理,能够使用,但是CPU的并行计算能力不够强大我们便准备了一套的GPU加速环境。具体参数为:RTX2080super,ubuntu 18.04,cuda10.2,cudnn7.6.5
由于我们的流程为:
graph TD
A[zed相机初始化]-->B(相机取视频流)
B-->C{是否有视频流}
C-->|yes| D[执行深度学习预测]
C-->|no| B
D-->E[返回画框结果与重点目标坐标]
E-->F(进行深度检测_测算距离)
F-->G[下一流程]
需要注意的是:这里的zed相机在形成点云的时候需要使用GPU,同样我们在进行深度学习的时候同样也要使用GPU,理论上我们两种算法是不会冲突的,但是由于我们使用了加速库cudnn
这一cuda库,但是这两个API同时需要调用cudnn
所以这就造成了cudnn
被占用的情况,就会出现上面的情况。
关于ZED的补充
由于zed的原始的视频中带有IMU
的数据等信息,所以在取流的时候我们得到的视频流拥有四个通道RGBA
,通常我们在进行目标检测的时候我们只需要前三个通道的信息,可以使用opencv
的函数进行转换,再进一步输出。
解决方案
一般来说,出现这种报错很多是由于深度学习的框架与cudnn
或者cuda
又或者python
的版本出现了不适配的情况,我们只需要仔细检测上述情况即可,但是在这种两个API调用同一个加速库而导致资源被占用,而导致的程序崩溃的情况,我们最好的建议是进行多线程处理,把两个调用的接口隔离在两个线程中,即可防止出现抢占资源的情况出现,如果在ROS系统中,我们同样十分建议使用ROS的通信机制来进行分开两个线程。
心灵鸡汤
那年十八,意气和风一块儿发。青春的舟随瀑布飞流下,追梦想的白马,不知觉中去长大。你未曾错过任何人,又为何必须错过那场盛夏。