20230805 Datawhale第一次直播笔记
机器学习上分技巧
内容解析
subtask是并列的,并且取最优,那么只需要针对最优进行优化
转化为回归问题是否会更加准确
数据分析和特征工程是非常关键的部分
数据探索性分析(EDA):
- 数据集大小,字段类型
- 缺失值情况
- 特征是否冗余
- 是否存在时间信息
- 标签的分布
- 训练集测试集的分布
- 单变量/多变量分布
特征工程
- 过滤法
- 封装法
- 嵌入法
模型融合
交叉
权重选择
subtask是并列的,并且取最优,那么只需要针对最优进行优化
转化为回归问题是否会更加准确
数据分析和特征工程是非常关键的部分
数据探索性分析(EDA):
特征工程
模型融合
交叉
权重选择
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 使用C#创建一个MCP客户端
· ollama系列1:轻松3步本地部署deepseek,普通电脑可用
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 按钮权限的设计及实现