随机森林笔记

随机森林是Bagging思想的代表
本文从视频中摘录出来👉 https://www.bilibili.com/video/BV1BE411Z76D/

Bagging

下图是bagging思想

个体学习器,就是弱学习器。

Bagging的个体学习器可以是SVM,可以是神经网络。

但随机森林特殊在它的个体学习器都是决策树


Bagging的策略如下:

Skelearn中的Bagging

base_estimator可以指定为神经网络、SVM都可以。当然默认是决策树。

袋外样本是因为通过随机抽取,最终是会有30%的数据没有抽取到的。

Sklearn中Bagging常用参数:

分类任务选Classifier,回归任务选Regressor

随机森林

Sklearn中随机森林常用参数:(bagging框架参数)

一般推荐袋外选True,这样可以测试会不会出现过拟合的情况(即适合测试样本的模型,但用其他样本测试就不再适合的情况)

Sklearn中随机森林常用参数:(决策树参数)

这些都是决策树的参数。

还是上面这句话:RandomForestClassifiler是分类任务/RandomForestRegressor是回归任务

**新手不要把线性可分和回归预测搞混在一起。这两个不是一个东西。 **

回归预测不需要你是否线性可分。

posted @ 2020-04-07 15:47  青墟  阅读(133)  评论(0编辑  收藏  举报