随笔分类 -  深度学习

摘要:考虑这段代码: x.grad.zero_() y = x * x u = y.detach() z = u * x z.sum().backward() x.grad == u 这里u = y.detach()意味着不将u看作一个变量组成的向量,而仅将 u 看作一个数字组成的向量,即u = [0, 阅读全文
posted @ 2024-03-23 10:08 hacker_dvd 阅读(8) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示