随机森林理解

https://www.cnblogs.com/maybe2030/p/4585705.html

随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。

将若干个弱分类器的分类结果进行投票选择,从而组成一个强分类器,这就是随机森林bagging的思想。

随机”是指以下两个随机性

(1)随机且有放回地从训练集(N个样本)中的抽取n个训练样本。

(2)如果每个样本的特征维度为M,指定一个常数m<<M,随机地从M个特征中选取m个特征子集,每次树进行分裂时,从这m个特征中选择最优的。

posted @ 2019-05-27 10:57  努力奔跑的Heilay  阅读(313)  评论(0编辑  收藏  举报