【转载】failed to initialize nvml driver/library version mismatch ubuntu


英伟达驱动版本是384.130


显示的NVRM version: NVIDIA UNIX x86_64 Kernel Module是:384.130。 若是旧的版本就会出现如下问题。

这个问题出现的原因是kernel mod 的 Nvidia driver 的版本没有更新,一般情况下,重启机器就能够解决,如果因为某些原因不能够重启的话,也有办法reload kernel mod。

方法如下:

 

就两步

  1. unload nvidia kernel mod
  2. reload nvidia kernel mod

执行

  1. sudo rmmod nvidia
  2. sudo nvidia-smi

若出现问题

  1. $ sudo rmmod nvidia
  2. rmmod: ERROR: Module nvidia is in use by: nvidia_modeset nvidia_uvm

这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,首先我们从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们


 

先查看下有哪些进程使用了 nvidia*

```

sudo fuser -v /dev/nvidia* #查找占用GPU资源的PID

sudo lsof -n -w /dev/nvidia* #查找占用GPU资源的PID

```


这些进程有个了解,如果一会卸载失败,记得关闭相关进程。

卸载

  1. sudo rmmod nvidia_uvm
  2. sudo rmmod nvidia_modeset

 

 

 

#参考文献

解决Driver/library version mismatch

NVIDIA驱动问题解决方案:Failed to initialize NVML: driver/library version mismatch

posted @   张杨  阅读(2945)  评论(0编辑  收藏  举报
编辑推荐:
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
· 25岁的心里话
点击右上角即可分享
微信分享提示