摘要:
Gradient boosting decision tree(使用的基分类器是CART回归树,不适用CART分类树) 还有一遍博客讲的很好:https://www.cnblogs.com/pinard/p/6140514.html 介绍: 首先gbdt 是通过采用加法模型(即基函数的线性组合),以 阅读全文
摘要:
ID3决策树:利用信息增益来划分节点 信息熵是度量样本集合纯度最常用的一种指标。假设样本集合D中第k类样本所占的比重为pk,那么信息熵的计算则为下面的计算方式 当这个Ent(D)的值越小,说明样本集合D的纯度就越高 有了信息熵,当我选择用样本的某一个属性a来划分样本集合D时,就可以得出用属性a对样本 阅读全文