摘要:
为超参数选择合适的范围( Using an appropriate scale to pick hyperparameters) 随机取值可以提升你的搜索效率。但随机取值并不是在有效范围内的随机均匀取值,而是选择合适的标尺,用于探究这些超参数,这很重要。 假设你要选取隐藏单元的数量${n^{[l]} 阅读全文
摘要:
调试处理( Tuning process) 按照参数的重要性依次排列: 学习速率$\alpha$ Momentum(动量梯度下降法)的参数$\beta$ 如果使用Adam 优化算法的参数${\beta _1}$,${\beta _2}$,$\varepsilon $,但是通常使用默认值:0.9,0. 阅读全文