pytorch05——动态调整网络学习率

在之前看论文，其实也有很多点说到这个问题（学习率的选择）。如果我们学习率设置的过小，会极大的降低模型收敛速度，从而大大增加了训练时间；如果学习率太大，可能导致参数在最优解来回震荡。但是当我们选定了一个合适的学习率的时候，经过多轮的训练后，可能会出现准确率震荡或loss不再下降等情况，说明之前设置的这个学习率现在已经不能满足模型调优的需求了。此时我们就可以通过一个适当的学习率衰减策略来改善这种现象，提高我们的精度。这种设置方式在pytorch被称为scheduler。

1.官方API

在训练神经网络过程中，学习率是最重要的超参数之一，Pytorch封装了以下包进行调整学习率

lr_scheduler.LambdaLR

lr_scheduler.MultiplicativeLR

lr_scheduler.StepLR

lr_scheduler.MultiStepLR

lr_scheduler.ExponentialLR

lr_scheduler.CosineAnnealingLR

lr_scheduler.ReduceLROnPlateau

lr_scheduler.CyclicLR

lr_scheduler.OneCycleLR

lr_scheduler.CosineAnnealingWarmRestarts

2.使用官方的API

关于如何使用这些动态调整学习率的策略，参考下面的代码


# 选择一种优化器
optimizer = torch.optim.Adam(...)
# 选择上面提到的一种或多种动态调整学习率的方法
scheduler1 = torch.optim.lr_scheduler....
scheduler2 = torch.optim.lr_scheduler....
...
schedulern = torch.optim.lr_scheduler....
# 进行训练
for epoch in range(100):
train(...)
validate(...)
optimizer.step()
# 需要在优化器参数更新之后再动态调整学习率
scheduler1.step()
...
schedulern.step()

# 注：我们在使用官方给出的torch.optim.lr_scheduler时，需要将scheduler.step()放在scheduler.step()后使用

3.自定义scheduler


def adjust_learning_rate(optimizer,epoch):

　　　lr = args.lr * (0.1**(epoch//30)) #每三十轮学习率降低百分之十
　　　 for param_group in optimizer.param_groups:
　　　　　　param_group['lr'] = lr

我们再通过adjust_learning_rate函数定义，在训练过程中就可以调用我们的函数来实现学习率的动态变化


def adjust_learning_rate(optimizer,...):
...
optimizer = torch.optim.SGD(model.parameters(),lr = args.lr,momentum = 0.9)
for epoch in range(10):
train(...)
validate(...)
adjust_learning_rate(optimizer,epoch)

posted @ 2022-03-18 10:18 TCcjx 阅读(551) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

TCcjx

pytorch05——动态调整网络学习率

1.官方API

2.使用官方的API

3.自定义scheduler

公告