摘要: 复习了下pytorch。 自动求导机制 从后向排除子图 每个变量有两个标志:requires_grad和volatile requires_grad 如果有一个单一的输入操作需要梯度,它的输出也需要梯度,反之亦然。 如果其中所有的变量都不需要梯度进行,后向计算不会执行 如果想冻结部分模型,或者不会使 阅读全文
posted @ 2020-03-11 23:51 甜酒果。 阅读(387) 评论(0) 推荐(0) 编辑