UBUNTU18.04 SERVER 多显卡 服务器,为防止显卡计算任务出现不意外报错,设置显卡工作状态为:设定持久模式

参考:

https://www.cnblogs.com/devilmaycry812839668/p/14799016.html

https://www.cnblogs.com/devilmaycry812839668/p/14799092.html

 

 

==============================================================

 

参考:

http://bbs.gpuworld.cn/index.php?topic=10353.msg20364

 

 

设定持久模式,(就是没人用GPU的时候,驱动不自动卸载,而是一直都处于加载状态)  
本次有效下次重启还需要重新设定。

默认状态是驱动每次用完都自动卸载的,然后重新加载。

一个常见的用途是,root设定了PM模式后,加载驱动了,然后普通用户可以方便的CUDA.

 

----------------------------------------------------------------------------

 

如果不加载这个,driver频繁卸载加载,GPU频繁被初始化,会导致GPU死机,CPU访问PCIe config registers时间过长导致 softlock。

driver不用的时候会卸载。

 

----------------------------------------------------------------------------

 

 

 

 

 

设置持久模式命令:

nvidia-smi -pm 1

 

posted on 2021-06-27 12:06  Angry_Panda  阅读(351)  评论(0编辑  收藏  举报

导航