摘要: mmdetection distributed train死锁问题 表现:设置某些参数,或在某些特定情况下GPU显存占满,但并不继续运行,暂停程序后停在(pid, sts) = os.waitpid(self.pid, wait_flags) 参考:distributed all_reduce de 阅读全文
posted @ 2021-02-26 12:38 TinaSmile 阅读(1186) 评论(1) 推荐(0) 编辑