摘要: eval_masks[eval_dones == True] = np.zeros( ((eval_dones == True).sum(), 1), dtype=np.float32)eval_rnn_states[eval_dones == True] = np.zeros( ((eval_do 阅读全文
posted @ 2021-12-01 19:23 呦呦南山 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 对于2个网络生成的loss,经过torch.max操作后形成一个loss,此时进行loss.backward则对应的是取max的网络的梯度更新。 阅读全文
posted @ 2021-12-01 16:55 呦呦南山 阅读(1038) 评论(0) 推荐(0) 编辑