2016年8月11日

过拟合与正则化的数学推导

摘要: 首先,我们看一下什么是过拟合,下面这张图右边,很明显,两类数据的分类率很高,采用了非常复杂的模型,讲两组数据分割开了。但是 我们仔细观察一下,那些混入蓝色区域的红色点,难道不是噪声引起了吗?因此要解决过拟合的问题,我们要讨论如何减少,混入测试数据集中的噪声。 我们以神经网络为例: 对于测试数据来说, 阅读全文

posted @ 2016-08-11 17:28 mitutao 阅读(1121) 评论(0) 推荐(0) 编辑

为什么是梯度下降?SGD

摘要: 在机器学习算法中,为了优化损失函数loss function ,我们往往采用梯度下降算法来进行优化。举个例子: 线性SVM的得分函数和损失函数分别为: 一般来说,我们是需要求损失函数的最小值,而损失函数是关于权值矩阵的函数。为了求解权值矩阵,我们一般采用数值求解的方法,但是为什么是梯度呢? 在CS2 阅读全文

posted @ 2016-08-11 16:37 mitutao 阅读(1666) 评论(0) 推荐(0) 编辑

导航