摘要: Adagrad //适合稀疏样本 RMSprop//借鉴Adagrad的思想,改进使得不会出现学习率越来越低的问题 由此可见Adadelta既不需要输入学习率等参数,而且表现得非常好!!但是我试了几次,这个优化器效果极差!!还是具体问题具体分析吧 由此可见只有SGD无法逃离局部最小值,此处仍然是Ad 阅读全文
posted @ 2019-08-11 09:16 程序杰杰 阅读(177) 评论(0) 推荐(0) 编辑