交叉验证

一、sklearn.cross_validation.cross_val_score

sklearn.cross_validation.cross_val_score(estimator, X, y=None, scoring=None,cv=None, n_jobs=1, verbose=0, fit_params=None, pre_dispatch=‘2*n_jobs’)

estimator:估计方法对象(分类器)
X：数据特征(Features)
y：数据标签(Labels)
soring：调用方法(包括accuracy和mean_squared_error等等)
cv：几折交叉验证
n_jobs：同时工作的cpu个数（-1代表全部）

二、sklearn.model_selection.KFold

sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)

n_splits：表示划分几等份

shuffle：在每次划分时，是否进行洗牌

random_state：随机种子数

属性：

① get_n_splits(X=None, y=None, groups=None)：获取参数n_splits的值

② split(X, y=None, groups=None)：将数据集划分成训练集和测试集，返回索引生成器

通过一个不能均等划分的栗子，设置不同参数值，观察其结果。

posted @ 2019-12-25 22:22 熊猫blue 阅读(213) 评论(0) 编辑收藏举报

刷新页面返回顶部

熊猫blue