xgboost
基本概念
Given dataset
a tree ensemble model uses K additive functions to predict the output
where,
是CART的集合
优化目标
其中,
为正则项
when train the model in additive manner, minimize the objective for
也即,
拟合的是
和
的差值
基于二阶泰勒展开
这是一条过
点的二次曲线,是
在
附近的近似
则可以针对
进行二次近似
进一步化解
其中