pytorch 笔记之 model.eval() 和 with torch.no_grad()

model.eval() 负责改变batchnorm、dropout的工作方式,如在eval()模式下,dropout是不工作的。

torch.no_grad() 负责关掉梯度计算,节省eval的时间。

只进行inference时,model.eval() 是必须使用的,否则会影响结果准确性。 而 torch.no_grad() 并不是强制的,只影响运行效率。

一般写为:

# evaluate model:
model.eval()
with torch.no_grad():
...
out_data = model(data)
...

实践经验:当我训练模型时候,训练集的精度一直提高,但是验证集和瞎猜一样,我以为可能是过拟合?尝试了精简模型架构,但是依旧如此。这明显不是过拟合问题,最后我发现自己的验证集生成错误了。

posted @   Zenith_Hugh  阅读(822)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 25岁的心里话
· 按钮权限的设计及实现
点击右上角即可分享
微信分享提示

喜欢请打赏

扫描二维码打赏

微信打赏