摘要: 在前面的文章中,已经介绍了从 "有约束条件下的凸优化角度思考神经网络训练过程中的L2正则化" ,本次我们从最大后验概率点估计(MAP,maximum a posteriori point estimate)的角度来理解神经网络中十分重要的weight decay正则化方法. "前面的文章" 中讲到了 阅读全文
posted @ 2019-06-27 22:40 碌碌无为的人 阅读(832) 评论(0) 推荐(0) 编辑
摘要: 深度学习中,常将可得的数据集划分为训练集(training set),验证集(development set/validation set)和测试集(test set).下文主要回答以下几个问题:一是为什么要将数据集划分为如上三个集合,三个集合之间有什么区别;二是我们划分的原则是什么. 1. 训练集 阅读全文
posted @ 2019-06-27 21:45 碌碌无为的人 阅读(30378) 评论(0) 推荐(3) 编辑