02 2023 档案

摘要:超算使用wandb总是连接超时,设置为offline模式即可 import os import wandb os.environ["WANDB_API_KEY"] = 'KEY' os.environ["WANDB_MODE"] = "offline" 阅读全文
posted @ 2023-02-09 18:48 不要肥宅 阅读(3248) 评论(0) 推荐(2) 编辑
摘要:错误原因:数据有的在cpu上有的在gpu上debug:断点到出错位置查看类型,或者打印`x.is_cuda`查看修改:将cpu上的数据通过`.to(device)`加载到gpu上 阅读全文
posted @ 2023-02-09 16:18 不要肥宅 阅读(1967) 评论(0) 推荐(0) 编辑
摘要:调试diffusion模型时在loss处报错,报错位置: `acc_train_loss += loss.item()` RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynch 阅读全文
posted @ 2023-02-09 14:38 不要肥宅 阅读(1851) 评论(0) 推荐(0) 编辑
摘要:1. 安装cuda nvidia-smi查看GPU信息,显示的CUDA Version是可以支持的最高版本cuda 去官网安装相应版本的cuda 安装后重新打开终端,nvcc --version,输出cud版本 2. 安装conda/miniconda 2.1 安装 到anaconda官网按指示安装 阅读全文
posted @ 2023-02-02 14:08 不要肥宅 阅读(61) 评论(0) 推荐(0) 编辑