摘要: 记录炼丹优化tricks 最后更新: 2020-04-15 18:17:57 寻找合适的学习率(learning rate) 学习率是一个非常非常重要的超参数,这个参数呢,面对不同规模、不同batch-size、不同优化方式、不同数据集,其最合适的值都是不确定的,我们无法光凭经验来准确地确定lr的值 阅读全文
posted @ 2020-04-09 16:50 山竹小果 阅读(8984) 评论(0) 推荐(4) 编辑