bagging and boosting

bagging 侧重于降低方差

  1. 方差-variance
    方差描述的是预测值的变化范围,离散程度,也就是离期真实值的距离。方差过大表现为过拟合,训练数据的预测f-score很高,但是验证或测试数据的预测f-score低很多。实际应用中表现为对新数据的泛化能力弱。例如:一个模型学习加减法运算,模型记忆能力非常好,对他所有训练过的数据,他都能做出精准的运输,但是一旦看到他没有见过的数据,就算不出来了。模型记住了历史的学习结果,但是没有真正掌握加减法运算规律;属于死记硬背的模型,不能灵活运用,这就过拟合了。

boosting 侧重于降低偏差

  1. 偏差-bias
    偏差描述预测值与真实值之间的差距。偏差过大表现为欠拟合,训练数据和验证数据的预测accuracy或f-score过低。实际应用中表现为对数据的预测能力不准确。例如:一个模型学习加减法运算,他根本没有学会加减运算,你给他再多的训练数据,还是老样子,就是不会,老实算错,就算你给他训练过的数据都是这样的。欠拟合。

bagging and boosting 区别在于的取样方式不同

posted @ 2017-11-27 10:20  james.yj  阅读(312)  评论(0编辑  收藏  举报