【dlbook】实践方法论
摘要:
【性能度量】 使用什么误差度量? 目标性能大致为多少? 【默认的基准模型】 首先尝试分段线性单元,ReLU以及扩展。 SGD一般是合理的选择,选加入动量的版本,衰减方法不一。 批标准化在优化出现问题时应该直接使用。 一开始就应该有一些温和的正则化 提前终止一般使用 Dropout比较容易实现,而且兼 阅读全文
posted @ 2018-02-01 17:56 yesuuu 阅读(169) 评论(0) 推荐(0) 编辑