摘要:
随机森林,是指用随机的方式建立一个森林,森林里面有许多决策树,且随机森林中的树与树之间是彼此独立的。在得到随机森林后,当有一个新的样本输入的时候,让森林中的每一棵树分别进行计算并进行统计汇总,得分最多的那个结果为最终的结果。随机森林既可以处理属性为离散值的样本(ID3算法),也可以处理属性为连续值的 阅读全文
摘要:
简介 lightGBM和XGBoost都是对GBDT模型的进化版本,原理上它和GBDT类似,也是采用损失函数的负梯度作为当前决策树的残差近似值,去拟合新的决策树。 GBDT既可以基于预排序特征值进行特征选取(可以忽略特征零值降低训练成本),也可以基于直方图进行特征选取。但是GBDT在使用直方图进行特 阅读全文