博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2021年3月3日

摘要: 这二者的功能是不同的: model.eval(): 告诉网络的所有层,你在eval模式,也就是说,像batchNorm和dropout这样的层会工作在eval模式而非training模式(如dropout层在eval模式会被关闭)。 with torch.no_grad(): 当我们计算梯度时,我们 阅读全文

posted @ 2021-03-03 20:56 秘密小鱼 阅读(984) 评论(0) 推荐(0)