UBUNTU18.04 SERVER 多显卡 服务器,为防止显卡计算任务出现不意外报错,设置显卡工作状态为:设定持久模式

参考:

https://www.cnblogs.com/devilmaycry812839668/p/14799016.html

https://www.cnblogs.com/devilmaycry812839668/p/14799092.html

 

 

==============================================================

 

参考:

http://bbs.gpuworld.cn/index.php?topic=10353.msg20364

 

 

设定持久模式,(就是没人用GPU的时候,驱动不自动卸载,而是一直都处于加载状态)  
本次有效下次重启还需要重新设定。

默认状态是驱动每次用完都自动卸载的,然后重新加载。

一个常见的用途是,root设定了PM模式后,加载驱动了,然后普通用户可以方便的CUDA.

 

----------------------------------------------------------------------------

 

如果不加载这个,driver频繁卸载加载,GPU频繁被初始化,会导致GPU死机,CPU访问PCIe config registers时间过长导致 softlock。

driver不用的时候会卸载。

 

----------------------------------------------------------------------------

 

 

 

 

 

设置持久模式命令:

nvidia-smi -pm 1

 

posted on   Angry_Panda  阅读(361)  评论(0编辑  收藏  举报

编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示