摘要: 使用了RamdomedSearchCV迭代100次,从参数组里面选择出当前最佳的参数组合 在RamdomedSearchCV的基础上,使用GridSearchCV在上面最佳参数的周围选择一些合适的参数组合,进行参数的微调 1. RandomedSearchCV(estimator=rf, param 阅读全文
posted @ 2019-01-24 19:49 python我的最爱 阅读(777) 评论(0) 推荐(0) 编辑
摘要: 我们进行了两部分的实验: 1:提取特征重要性之和大于95%的前5个特征,进行结果的预测,并统计时间 直接使用特征进行结果的预测,统计时间 2:在上述的基础上,研究了少量数据集所花的时间,以及精度的差异 代码: 第一步:数据读取 第二步:pd.dummies() 对文本标签进行one-hot编码 第三 阅读全文
posted @ 2019-01-24 16:35 python我的最爱 阅读(778) 评论(0) 推荐(0) 编辑
摘要: 在上一个博客中,我们构建了随机森林温度预测的基础模型,并且研究了特征重要性。 在这个博客中,我们将从两方面来研究数据对预测结果的影响 第一方面:特征不变,只增加样本的数据 第二方面:增加特征数,增加样本的数据 1.sns.pairplot 画出两个变量的关系图,用于研究变量之间的线性相关性,sns. 阅读全文
posted @ 2019-01-24 11:01 python我的最爱 阅读(1795) 评论(1) 推荐(0) 编辑