摘要: 为超参数选择合适的范围( Using an appropriate scale to pick hyperparameters) 随机取值可以提升你的搜索效率。但随机取值并不是在有效范围内的随机均匀取值,而是选择合适的标尺,用于探究这些超参数,这很重要。 假设你要选取隐藏单元的数量${n^{[l]} 阅读全文
posted @ 2018-09-18 22:41 刘-皇叔 阅读(765) 评论(0) 推荐(0) 编辑
摘要: 调试处理( Tuning process) 按照参数的重要性依次排列: 学习速率$\alpha$ Momentum(动量梯度下降法)的参数$\beta$ 如果使用Adam 优化算法的参数${\beta _1}$,${\beta _2}$,$\varepsilon $,但是通常使用默认值:0.9,0. 阅读全文
posted @ 2018-09-18 20:50 刘-皇叔 阅读(374) 评论(0) 推荐(0) 编辑