摘要: 当模型有多输出的时候,容易产生此问题,如以下程序所示: # zero the parameter gradients model.zero_grad() # forward + backward + optimize outputs, hidden = model(inputs, hidden) l 阅读全文
posted @ 2019-11-29 18:31 RamboBai 阅读(8234) 评论(0) 推荐(0) 编辑