6.6.2 模型训练

f isinstance(net, nn.Module):
        net.eval()  # 设置为评估模式
        if not device:
            device = next(iter(net.parameters())).device

对于这段代码，作用如下

net.eval()设置为评估模式之后，某些层（如 Dropout 和 BatchNorm）的行为会与训练模式不同。例如：
- Dropout 层在评估模式下不会随机丢弃神经元。
- BatchNorm 层在评估模式下会使用训练时计算的均值和方差，而不是当前批次的统计量。
net.train()的行为就完全与上面的相反
device = next(iter(net.parameters())).device是在获取当前网络所在的设备（CPU或者GPU）。从后面的代码来看，我们最开始是在GPU上面建立的网络，所以这里device会是GPU。注意，net.parameters()返回的是一个容器（不是一个列表，所以net.parameters()[0]是错误的），iter(net.parameters())是将这个容器转变为可迭代对象，next(iter(net.parameters()))是在获取第一个参数

posted @ 2025-02-20 12:26 最爱丁珰阅读(5) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 4.4.2 模型选择

· 15.7.3 微调BERT

· model

· 使用model.eval( ) 和 torch.no_grad( )的情况

· pytorch 学习记录

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构

历史上的今天：
2024-02-20 Blocking Elements
2024-02-20 XOR-distance
2024-02-20 Minimize Inversions
2024-02-20 Lonely Mountain Dungeons
2024-02-20 Modular Sequence
2024-02-20 Equalize
2024-02-20 世界树

昵称：最爱丁珰
园龄： 3年7个月
粉丝： 3
关注： 0

2025年3月

日

一

二

三

四

五

六

最爱丁珰