数据挖掘--模型融合

理论来说,如果不同的模型在评分上类似但是结果上差异较大,那么这些不同的模型融合效果会比较理想.

内容简介

1. 简单加权融合:

  • 回归(分类概率):算术平均融合,集合平均融合(权重的差异不宜过大)
  • 分类:投票(Voting)
  • 综合: 综合排序(Rank averaging),log融合  (分线性)

2. stacking/blending

  • 构建多层模型,并利用预测结果再拟合预测

3. boosting/bagging(xgboost,Adaboost,GBDT已经用到)

  • 多树的提升方法

 

Stacking

  简单来说stacking是使用初始训练集数据学习出若干个基学习器之后,将这几个学习器的预测结果作为新的训练集,来学习一个新的学习器。

  

 # 记得看一下预测结果的统计信息,根据实际的情况做一些结果的后处理

 

 

posted @ 2020-04-06 20:44  猪突猛进!!!  阅读(464)  评论(0编辑  收藏  举报