kZjPBD.jpg

修改optimizer的 学习率


def step(self): "Update parameters and rate" self._step += 1 rate = self.rate() for p in self.optimizer.param_groups: p['lr'] = rate self._rate = rate self.optimizer.step()

param———groups 代表了有几组需要优化的网络,用在同时优化多个网络的情形。


print("optimizer_3.defaults:", trainer.defaults)
print("optimizer_3.param_groups长度:", len(trainer.param_groups))
print("optimizer_3.param_groups一个元素包含的键:", trainer.param_groups[0].keys())

optimizer_3.defaults: {'lr': 0.5, 'momentum': 0, 'dampening': 0, 'weight_decay': 0.001, 'nesterov': False}
optimizer_3.param_groups长度: 2
optimizer_3.param_groups一个元素包含的键: dict_keys(['params', 'lr', 'momentum', 'dampening', 'weight_decay', 'nesterov'])


trainer= torch.optim.SGD([{'params': params_1x},
{'params': net.fc.parameters(),'lr': learning_rate * 10}],lr=learning_rate, weight_decay=0.001)

这里看出向traine中传递力两组的param,由于第一组没有设置‘lr’,因此使用了defaults中的‘lr‘

posted @   Through_The_Night  阅读(134)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 单元测试从入门到精通
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
点击右上角即可分享
微信分享提示