Unable to determine the device handle for GPU 0000:01:00.0: GPU is lost.问题排坑
在运行maskrcnn时,会碰到训练不动的问题,就卡在这儿
1 2 3 4 | UserWarning: Converting sparse IndexedSlices to a dense Tensor of unknown shape. This may consume a large amount of memory. "Converting sparse IndexedSlices to a dense Tensor of unknown shape. " Epoch 1/10 image_id 31 |
然后根据一些博主建议,用最新的mrcnn代码代码试了试,这回会报错了
Failed to get device properties, error code: 30
然后用nvidia-smi在cmd试了试,果然GPU又挂了,之前就一直出现GPU训练一次后会挂掉,必须重启电脑才行
Unable to determine the device handle for GPU 0000:01:00.0: GPU is lost.
查询一些博客才知道可能是CUDA版本和驱动问题,我觉得我CUDA应该没问题,用的9.2版本,那就改驱动吧
把驱动更新退回上一次更新的版本就可以正常运行了,这么一个小问题花了三天时间,都是泪啊,主要是碰到这个问题的人太少了。退回后我的显卡驱动版本是398.27
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】