UBUNTU18.04 SERVER 多显卡 服务器,为防止显卡计算任务出现不意外报错,设置显卡工作状态为:设定持久模式
参考:
https://www.cnblogs.com/devilmaycry812839668/p/14799016.html
https://www.cnblogs.com/devilmaycry812839668/p/14799092.html
==============================================================
参考:
http://bbs.gpuworld.cn/index.php?topic=10353.msg20364
设定持久模式,(就是没人用GPU的时候,驱动不自动卸载,而是一直都处于加载状态)
本次有效下次重启还需要重新设定。
默认状态是驱动每次用完都自动卸载的,然后重新加载。
一个常见的用途是,root设定了PM模式后,加载驱动了,然后普通用户可以方便的CUDA.
----------------------------------------------------------------------------
如果不加载这个,driver频繁卸载加载,GPU频繁被初始化,会导致GPU死机,CPU访问PCIe config registers时间过长导致 softlock。
driver不用的时候会卸载。
----------------------------------------------------------------------------
设置持久模式命令:
nvidia-smi -pm 1
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
posted on 2021-06-27 12:06 Angry_Panda 阅读(351) 评论(0) 编辑 收藏 举报