摘要: 先介绍一下 Caffe 和 TensorFlow 中 weight decay 的设置: 在 Caffe 中, SolverParameter.weight_decay 可以作用于所有的可训练参数, 不妨称为 global weight decay, 另外还可以为各层中的每个可训练参数设置独立的 d 阅读全文
posted @ 2020-10-21 23:28 quarryman 阅读(10811) 评论(2) 推荐(0) 编辑