摘要: 学习率衰减: 在迭代到后期可能因为学习率的问题导致一直在一个大范围动荡无法更近一步靠近低点,所以要调整学习率以求达到低点,使用迭代次数自动衰减是挺好的办法; 遍历完一次训练集为一代 —————————————————————————————————————————————————————— 为超参数 阅读全文