sklearn.feature_selection.SelectFromModel 特征重要性选择(嵌入法的一种)
摘要:嵌入式特征选择在学习器训练过程中自动地进行特征选择。嵌入式选择最常用的是L1正则化与L2正则化。 SelectFromModel是一个元变压器,可与拟合后具有coef_或feature_importances_属性的任何估算器一起使用。如果相应的coef_或feature_importances_值
阅读全文
posted @
2020-08-31 12:22
小小喽啰
阅读(3934)
推荐(0) 编辑
sklearn.model_selection.StratifiedShuffleSplit 分层抽样(交叉验证法的一种)
摘要:sklearn.model_selection.StratifiedShuffleSplit 主要用于数据不均匀的时候,比如在医疗数据当中得癌症的人比不得癌症的人少很多,此交叉验证对象是StratifiedKFold和ShuffleSplit的合并,返回分层的随机折叠。折叠是通过保留每个类别的样品百
阅读全文
posted @
2020-08-31 11:23
小小喽啰
阅读(1181)
推荐(0) 编辑
mlxtend.feature_selection 特征工程
摘要:特征选择 主要思想:包裹式(封装器法)从初始特征集合中不断的选择特征子集,训练学习器,根据学习器的性能来对子集进行评价,直到选择出最佳的子集。包裹式特征选择直接针对给定学习器进行优化 案例一、封装器法 常用实现方法:循序特征选择。 循序向前特征选择:Sequential Forward Select
阅读全文
posted @
2020-08-18 14:51
小小喽啰
阅读(2598)
推荐(0) 编辑
sklearn.metrics.classification_report分类模型评估
摘要:sklearn.metrics.classification_report()模型评估的一种,输出一个报告 sklearn.metrics.classification_report(y_true, y_pred, labels=None, target_names=None, sample_wei
阅读全文
posted @
2020-08-17 17:47
小小喽啰
阅读(2337)
推荐(0) 编辑
sklearn.preprocessing归一化标准化等
摘要:目录 sklearn.preprocessing StandardScaler,标准化,也叫z-score规范化 最小-最大规范化 正则化(normalize) one-hot编码 特征二值化 标签编码(Label encoding) sklearn.preprocessing 属于数据预处理阶段,
阅读全文
posted @
2020-07-21 15:18
小小喽啰
阅读(3037)
推荐(0) 编辑
sklearn.model_selection
摘要:划分数据集方法: 留出法(train_test_split) 交叉验证法 KFold方法 k折交叉验证 RepeatedKFold p次k折交叉验证 LeaveOneOut 留一法 LeavePOut 留P法 ShuffleSplit 随机分配 自助法 一、留出法 留出法的想法很简单,将原始数据直接
阅读全文
posted @
2020-07-09 15:48
小小喽啰
阅读(5096)
推荐(1) 编辑
sklearn.datasets
摘要:sklearn.datasets 1.波士顿房价数据 #波士顿房价数据集 from sklearn.datasets import load_boston import pandas as pd boston=load_boston() boston.data boston.target bosto
阅读全文
posted @
2020-07-09 11:25
小小喽啰
阅读(514)
推荐(0) 编辑
sklearn.metrics 模型评估指标
摘要:一、分类指标 1.accuracy_score(y_true,y_pre):准确率 总的来说就是分类正确的样本占总样本个数的比例,数据越大越好, 但是有一个明显的缺陷,即是当不同类别样本的比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素,就会出现准确率很高,但是auc却很低的情况(样本不
阅读全文
posted @
2020-07-08 17:06
小小喽啰
阅读(3535)
推荐(0) 编辑