集成学习——GBDT--企业神器

最近在网上点击了不好啊岗位查看岗位需求，不少的岗位都提到了GBDT，既然如此，分三步整理出GBDT的主线思路。

1.复习一下课程

2.网上查阅一下资料

3.手写一下笔记

Grandint Boosting Decision Tree（梯度提升决策树）

残差学习，运用到的数学技巧很多，传统模型也就是这个特点。数学性强，到了深度学习最主要就是堆机器了。

思想：串行进行m轮学习，每一轮学习，该轮和目标直指的残差。最终求和m个学习器，得到分类（回归）模型。

对于分类问题：

回到，GBDT流程，研究一下GBDT究竟学的是什么？

我们知道，最终的分类器 fm₌f_m-1 +h_m.

展开损失函数：

在第m轮，f_m-1是已知的，所以，h_m是需要学习的对象。

这部分数学比较复杂，记住结论：

第m轮，h_m（x）学习的目标是

，根据此公式，训练数据通过它之后就可以得到一个一一对应的数据集合W（这个数据集的意义是：每个的对应的值代表了xi和目标值的残差，是下一轮学习的目标）。

对数据集合W，建树。

最终的学习目标hi是该数据在树上最后落到的字节的点数据集经过C运算，得到的值：。软化，增强泛化性。

最终的到。

总结集成学习三大模型

posted on 2021-06-07 10:31 life‘s_a_struggle 阅读(86) 评论(0) 编辑收藏举报

刷新页面返回顶部