打赏
禅在心中
东风夜放花千树,更吹落、星如雨。宝马雕车香满路。凤箫声动,玉壶光转,一夜鱼龙舞。 蛾儿雪柳黄金缕,笑语盈盈暗香去。众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。

Bagging算法:

将训练数据集进行N次Bootstrap采样得到N个训练数据子集,对每个子集使用相同的算法分别建立决策树,最终的分类(或回归)结果是N个决策树的结果的多数投票(或平均)。

其中,Bootstrap即为有放回的采样,利用有限的样本资料经由多次重复抽样,重新建立起足以代表母体样本分布之新样本。

 

随机森林:

随机森林是基于Bagging策略的修改算法,样本的选取采用Bootstrap采样,而属性集合也采用Bootstrap采样(不同之处)。

传统决策树在选择划分属性时是在当前结点的属性集合中选择一个最优属性;而在RF中,对每个样本构架决策树时,其每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集,然后再从这个子集中选择一个最优属性用于划分.。

 

posted on 2017-11-22 23:08  禅在心中  阅读(1736)  评论(0编辑  收藏  举报