梯度下降
摘要:
调节学习率 微分大小意味着离最小值的距离 c点和a点c的微分较大,但是离最低点更近。 那么微分大小意味着离最小值的距离仅在不跨元素时才成立 考虑到二次微分 左边 :走的稳定右边: 步伐小,散乱。但快 feature scaling 特征缩放 w2的变化对y影响大w1的变化对y(loss)影响小,微分 阅读全文
posted @ 2020-02-14 22:15 cltt 阅读(140) 评论(0) 推荐(0) 编辑
posted @ 2020-02-14 22:15 cltt 阅读(140) 评论(0) 推荐(0) 编辑
posted @ 2020-02-14 20:55 cltt 阅读(835) 评论(0) 推荐(0) 编辑