gpu 驱动安装失败处理
gpu 驱动安装失败处理
描述: 部署完平台后,nvidia-smi 命令不存在,或者不能检测到 gpu,平台 gpu 功能不可用。
关键字: gpu, driver, nvidia, clever, docker
现象:
在部署时,Install nvidia driver 这个过程会输出失败日志,但不会导致部署失败
部署完 kernel 后,nvidia-smi 命令不存在,或者不能检测到 gpu 平台资源里面看不到 GPU
解决方案:
参考附录确保是已支持的 GPU 型号
进入 gpu 节点的 /root/.clever/driver 目录,执行 sh NVIDIA-Linux-x86_64-384.98.run 尝试手动安装驱动
如果报错,说设备被使用 nouveau 占用,或者登陆了图形化界面,请先重启后,再重新安装
分类:
GPU 使用问题汇总
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek “源神”启动!「GitHub 热点速览」
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求
· NetPad:一个.NET开源、跨平台的C#编辑器
2022-06-25 Kubernetes——Secret资源
2022-06-25 Kubernetes——应用程序配置管理及 ConfigMap 资源
2022-06-25 Kubernetes——利用环境变量(env.value or env.valueFrom)配置容器应用
2022-06-25 Kubernetes——容器应用配置的配置方式
2022-06-25 Kubernetes——downwardAPI存储卷
2022-06-25 Kubernetes——PV 和 PVC 的生命周期