Failed to initialize NVML: Driver/library version mismatch
查看nvidia驱动,报错
$ nvidia-smi
Failed to initialize NVML: Driver/library version mismatch
排查思路:1.查看显卡驱动所使用的内核版本
# cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 440.100 Fri May 29 08:45:51 UTC 2020
这里显示nvidia内核驱动版本是440.100。
2.查看服务器的驱动版本
# cat /var/log/dpkg.log | grep nvidia
从画蓝色线条的地方分析,系统版本被升级为450.102.04了。
如此找到原因了,nvidia的内核版本是440.100,而现在服务器的系统版本是450.102.04,两者不匹配。
解决有两种方式:1. 先卸载nvidia驱动sudo apt-get purge nvidia* ,而后重新安装驱动。2. 重启服务器,nvidia的内核版本会自动匹配升级。
结束。