NVRM: Xid (PCI:0000:b1:00): 13, pid=1375637, Graphics SM Global Exception on (GPC 0, TPC 1, SM 1): Multiple Warp Errors

显卡服务器中一个显卡崩溃了:

May 16 05:38:58 dell kernel: [14244871.006970] NVRM: Xid (PCI:0000:b1:00): 13, pid=1375637, Graphics SM Warp Exception on (GPC 0, TPC 0, SM 0): Illegal Instruction Encoding
May 16 05:38:58 dell kernel: [14244871.010256] NVRM: Xid (PCI:0000:b1:00): 13, pid=1375637, Graphics Exception: ESR 0x504730=0x30009 0x504734=0x0 0x504728=0x4c1eb72 0x50472c=0x174

 

 

个人估计是显卡过热导致的。找到一个解决方法:

sudo nvidia-smi -pl 150    # 把功率限制从默认的250W调整到150W

 

 

 

 

参考:

[杂记] Nvidia-smi显卡丢失以及GPU Fan显示ERR!

 

 

 

=========================================

 

 

 

 

 

 

 

=====================================

posted on   Angry_Panda  阅读(685)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
历史上的今天:
2022-05-17 强化学习分布式经验回放框架(experience replay)reverb的安装
2022-05-17 【转载】Ubuntu20.04安装Bazel
2022-05-17 ubuntu20.04/22.04 系统环境下源码编译Python3.10
2022-05-17 Ubuntu Firefox浏览器播放视频报错,提示“需要安装所需的视频编码器”——解决方法:安装视频解码器
2019-05-17 【转载】 兰德系数、调整兰德系数 (聚类评价标准)
2017-05-17 Ubuntu 16.04 LTS安装 cuda8.0
2017-05-17 ubuntu16.04 下 NVIDIA GTX1050ti 显卡驱动 PPA安装

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示