摘要: 模型融合,模型融合方式任意,并结合Task5给出你的最优结果。 例如Stacking融合,用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分结果。 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 "statu 阅读全文
posted @ 2019-05-22 22:09 Hero11best 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 使用网格搜索法对5个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估,记得展示代码的运行结果。 时间:2天 1.利用GGridSearchCV调参 1.1参数选择 首先选择5个模型要调的参数,这里是根据以前在知乎看的一张图片(感谢大佬!) 1.2划分验证集 本来想用sklearn的模块划 阅读全文
posted @ 2019-05-19 23:02 Hero11best 阅读(506) 评论(0) 推荐(0) 编辑
摘要: 记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线。时间:2天 可以参照以下格式: 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期 阅读全文
posted @ 2019-05-17 13:58 Hero11best 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 用逻辑回归、svm和决策树;随机森林和XGBoost进行模型构建,评分方式任意,如准确率等。(不需要考虑模型调参)时间:2天 数据集下载 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签:0表示未逾期,1表示逾期。 1. 阅读全文
posted @ 2019-05-16 17:05 Hero11best 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 【Task2(2天)】特征工程 特征衍生 特征挑选:分别用IV值和随机森林等进行特征选择 ……以及你能想到特征工程处理 说明:这份数据集是金融数据(非原始数据,已经处理过了),我们要做的是预测贷款用户是否会逾期。表格中 "status" 是结果标签:0表示未逾期,1表示逾期。 描述:任务、遇到的问题 阅读全文
posted @ 2019-05-14 21:52 Hero11best 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 1.引言 最近也学习了好几个月的机器学习,感觉知识也只停留在理论方面,但是大佬也说过实战很重要!!所以自己看了几篇Kaggle的文章。刚好前几天加入了一个打卡群,这是第一次发布的数据挖掘任务,在这里记录一下。 任务1 - 数据分析(2天),任务1打卡链接提交截止日期为20190512晚上10点数据集 阅读全文
posted @ 2019-05-12 13:22 Hero11best 阅读(335) 评论(0) 推荐(0) 编辑