摘要: 在没有Batch Normalization层的情况下,要用相对来讲较小的学习率。 阅读全文
posted @ 2019-04-01 10:57 阿刚的代码进阶之旅 阅读(221) 评论(0) 推荐(0) 编辑