2018年4月12日

sklearn-pipeline、GridSearchCV、train_test_split

摘要: 1、pipeline pipeline 实现了对全部步骤的流式化封装和管理,可以很方便地使参数集在新数据集上被重复使用。 (当我们对训练集应用各种预处理操作时(特征标准化、主成分分析等等),我们都需要对测试集重复利用这些参数。) pipeline 可以用于下面几处: 模块化 Feature Tran 阅读全文

posted @ 2018-04-12 17:05 hester-tang 阅读(453) 评论(0) 推荐(0) 编辑

机器学习分类模型评价指标和方法

摘要: 一、ROC曲线: 1、混淆矩阵: 针对二元分类问题,将实例分为正类或者负类,会出现四种情况: (1)实例本身为正类,被预测为正类,即真正类(TP); (2)实例本身为正类,被预测为负类,即假负类(FN); (3)实例本身为负类,被预测为正类,即假正类(FP); (4)实例本身为负类,被预测为负类,即 阅读全文

posted @ 2018-04-12 17:03 hester-tang 阅读(1162) 评论(0) 推荐(0) 编辑

导航