摘要: 1 产生过拟合的三个原因 过拟合就是Ein很小,而Eout很大的情况。产生过拟合的三个原因是,使用了过大的VC维,噪声,数据量太小: 2 如何解决过拟合 (1)从简单的model开始做; (2)数据清理/裁剪: (3)收集更多的数据; (4)数据提示; (5)正则化(后面介绍); (6)验证(后面介 阅读全文
posted @ 2017-01-24 13:38 coldyan 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 1 非线性变换 所谓非线性变换,就是把原始的特征做非线性变换,得到一个新的特征,使用这个新的特征来做线性的分类,则对应到原始的特征空间中,相当于做了非线性的分类。非线性变换的好处是,算法将有更多的选择,Ein可以做的更低。 例如使用二次变换: 则Z空间中的一个直线分类边界,对应到原来空间中是一个二次 阅读全文
posted @ 2017-01-24 11:21 coldyan 阅读(4389) 评论(0) 推荐(0) 编辑