07 2019 档案
摘要:集成学习是通过构架并结合多个学习器来处理学习任务的一种思想, 目前主要分为两大类:Boosting和Bagging. 对于任意一种集成方法, 我们都希望学习出来的基分类器具有较高的准确性和多样性, 基分类器的准确性可以保证集成的结果的准确性, 而对多样性的要求则能够使得集成分类器具有较强的泛化性能.
阅读全文
摘要:1. 过拟合 过拟合是指在模型的训练阶段过分拟合训练数据的特征,模型的训练数据上具有较小的误差。数据中的噪声也有可能被模型所学习,使得模型的泛化性能较差。 通常导致过拟合产生的原因包括: (1). 目标函数中没有相应的正则化项作为惩罚项, 常用的正则化项包括L1 和L2,其中L1约束能够学习出稀疏的
阅读全文