第二课 经济金融案例实战

导入数据并观察

合并数据

image
这里可能有个问题。我们说不要让模型提前见到数据,那么这里将训练集和测试集合并起来处理是否违反了这个规则呢?实际上,现实中我们是拿不到测试集的,所以不存在这个问题,在竞赛中,我们拿到了测试集,为了让模型的效果更好,我们会故意让模型提前看到测试集的一部分

提取出标签并对标签进行处理

image
image
image
image
image

合并训练集和测试集

image

变量转化

image

正确化变量属性

image
image
image
image

对分类型特征进行独热编码

image
image
image

填写数值型特征的缺失值

image
image
image
image
image

标准化数值型特征

image
image
image
image

建立模型

分出训练集和测试集

image

集成

Stackinhg

image
image
image
image
image
image
上面是很简单的集成,下面是比较正常的集成
image

Bagging

image
image
image
image
image

Boosting

image
image
image

XGBoost

image
image
image
image

提交结果

看到了1:28:15

posted @   最爱丁珰  阅读(4)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构
历史上的今天:
2024-02-11 杀人游戏
2024-02-11 从u到v还是从v到u?
2024-02-11 嗅探器
2024-02-11 北大ACM队的远足
2024-02-11 学校网络
点击右上角即可分享
微信分享提示