Bagging Classifier+Regressor

from sklearn.ensemble import BaggingRegressor

Bagging通过引入随机化增大每个估计器之间的差异。

参数介绍:

    base_estimator:Object or None。None代表默认是DecisionTree,Object可以指定基估计器(base estimator)。

    n_estimators:int, optional (default=10) 。   要集成的基估计器的个数。

    max_samples: int or float, optional (default=1.0)。决定从x_train抽取去训练基估计器的样本数量。int 代表抽取数量,float代表抽取比例

    max_features : int or float, optional (default=1.0)。决定从x_train抽取去训练基估计器的特征数量。int 代表抽取数量,float代表抽取比例

    bootstrap : boolean, optional (default=True) 决定样本子集的抽样方式(有放回和不放回)

    bootstrap_features : boolean, optional (default=False)决定特征子集的抽样方式(有放回和不放回)

    oob_score : bool 决定是否使用包外估计(out of bag estimate)泛化误差

    warm_start : bool, optional (default=False) true代表

    n_jobs : int, optional (default=1) 

    random_state : int, RandomState instance or None, optional (default=None)。如果int,random_state是随机数生成器使用的种子; 如果RandomState的实例,random_state是随机数生成器; 如果None,则随机数生成器是由np.random使用的RandomState实例。

    verbose : int, optional (default=0) 

属性介绍:

    estimators_ : list of estimators。The collection of fitted sub-estimators.

    estimators_samples_ : list of arrays

    estimators_features_ : list of arrays

    oob_score_ : float,使用包外估计这个训练数据集的得分。

    oob_prediction_ : array of shape = [n_samples]。在训练集上用out-of-bag估计计算的预测。 如果n_estimator很小,则可能在抽样过程中数据点不会被忽略。 在这种情况下,oob_prediction_可能包含NaN。

还要解决三个问题

①他到底是什么,用于什么情况?

  BaggingRegressor就是一个Bagging的回归器组合。说到底还是用于集成多个回归器,所以还是会勇于回归预测的情况,集成一下解决过拟合的问题。

②他的优缺点?

  

③调参过程?

from sklearn.ensemble import BaggingClassifier

posted @ 2017-05-15 21:25  苏羽垄  阅读(3973)  评论(0编辑  收藏  举报