gpu 驱动安装失败处理

gpu 驱动安装失败处理

描述: 部署完平台后,nvidia-smi 命令不存在,或者不能检测到 gpu,平台 gpu 功能不可用。

关键字: gpu, driver, nvidia, clever, docker

现象:

  在部署时,Install nvidia driver 这个过程会输出失败日志,但不会导致部署失败

  部署完 kernel 后,nvidia-smi 命令不存在,或者不能检测到 gpu 平台资源里面看不到 GPU

解决方案:

  参考附录确保是已支持的 GPU 型号

  进入 gpu 节点的 /root/.clever/driver 目录,执行 sh NVIDIA-Linux-x86_64-384.98.run 尝试手动安装驱动

  如果报错,说设备被使用 nouveau 占用,或者登陆了图形化界面,请先重启后,再重新安装

posted @   左扬  阅读(153)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· NetPad:一个.NET开源、跨平台的C#编辑器
历史上的今天:
2022-06-25 Kubernetes——Secret资源
2022-06-25 Kubernetes——应用程序配置管理及 ConfigMap 资源
2022-06-25 Kubernetes——利用环境变量(env.value or env.valueFrom)配置容器应用
2022-06-25 Kubernetes——容器应用配置的配置方式
2022-06-25 Kubernetes——downwardAPI存储卷
2022-06-25 Kubernetes——PV 和 PVC 的生命周期
levels of contents
点击右上角即可分享
微信分享提示