随笔 - 384  文章 - 0  评论 - 35  阅读 - 142万

数据挖掘提分三板斧-转

数据挖掘提分三板斧:

1.金斧-数据清洗和特征工程

2.银斧-模型参数调节

3.铜斧-模型集成

数据清洗和特征工程

一、关于数据清洗

1.缺失值处理:

 

 2.异常值处理:

 

 3.数据分桶:

 

 

4.数据标准化:在不同的问题中,标准化的意义不同

(1)在回归预测中,标准化是为了让特征值有均等的权重;

(2)在训练神经网络的过程中,通过将数据标准化,能够加速权重参数的收敛;

(3)主成分分析中,需要对数据进行标准化处理;默认指标间权重相等,不考虑指标间差异和相互影响。

二、关于特征工程

 

 

 1.特征构造:

 

 

 

 2.特征选择:

 

 

模型参数调节

一、关于建模调参

 

 1.理解模型

 

 2.性能验证

 

 3.模型调参

 

 

模型集成

一、关于模型集成

 

 1.加权融合

 

 2.Boosting/Bagging

 

 3.Stacking/Blending

 

 视频:https://www.bilibili.com/video/BV1MU4y1h75G

文章来自:https://mp.weixin.qq.com/s/41OmNMK1VFKQRuW6D7kqgA

本文只做笔记,不做任何商业用途

 

posted on   小小喽啰  阅读(206)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示