摘要: KFold分成不同的份数进行模型的平均表现输出即可#1-1KFold交叉验证方式from sklearn.datasets import load_irisfrom sklearn.feature_selection import SelectKBest,f_classiffrom sklearn. 阅读全文
posted @ 2020-05-27 18:53 The-Chosen-One 阅读(1081) 评论(0) 推荐(0) 编辑
摘要: XGboost数据比赛实战之调参篇(完整流程) 首先,很幸运的是,Scikit-learn中提供了一个函数可以帮助我们更好地进行调参: sklearn.model_selection.GridSearchCV 常用参数解读: estimator:所使用的分类器,如果比赛中使用的是XGBoost的话, 阅读全文
posted @ 2020-05-27 18:51 The-Chosen-One 阅读(685) 评论(0) 推荐(0) 编辑
摘要: 单变量特征选择 单变量特征选择是通过选择那些基于单变量统计检验(univariate statistical tests)得出的最优特征来实现的。它可以看作是估计器的一个预处理步骤。Scikit-learn将一系列特征选择程序作为不同的类提供给我们,这些类都实现了 transform 方法: Sel 阅读全文
posted @ 2020-05-27 18:17 The-Chosen-One 阅读(792) 评论(0) 推荐(0) 编辑
摘要: #机器学习项目实战1-泰坦尼克号获救预测#1-1数据导入pandas库import pandas as pdpd.set_option("max_columns",1000) #设置最大展示列的数目为1000pd.set_option("max_rows",1000) #设置最大展示行的数目为100 阅读全文
posted @ 2020-05-27 17:36 The-Chosen-One 阅读(750) 评论(0) 推荐(0) 编辑