摘要: 1. 关闭模型froward信息 2. 学习率 step: 配合stepsize,迭代次数达到stepsize的整数倍改变一次, base_lr * gamma ^ (floor(iter/ stepsize)) 学习率变化如下: multistep: 配合stepvalue, 迭代次数每到一个st 阅读全文
posted @ 2018-10-30 09:34 tszs_song 阅读(307) 评论(0) 推荐(0) 编辑