摘要: 一、前序工作流程 1. 数据处理 数据清洗 不可信的样本丢掉 缺省值极多的字段考虑不用 数据采样 下/上采样 保证样本均衡 2. 特征工程 特征处理: 数值型  类别型 Ž 时间类  文本型  统计型 ‘ 组合特征 特征选择: 过滤型 sklearn.feature_selection.Sel 阅读全文
posted @ 2019-03-06 17:47 大数据和AI玩出的梗 阅读(1592) 评论(0) 推荐(0) 编辑
摘要: 一、前言 1.机器学习与特征工程的关联 2.实际工业界的特征工程那些事儿 特征工程 特征 => 数据中抽取出来的对结果预测有用的信息 特征工程是使用专业背景知识和技巧处理数据,使得 特征能在机器学习算法上发挥更好的作用的过程。 意义 更好的特征意味着更强的灵活度 更好的特征意味着只需用简单模型 更好 阅读全文
posted @ 2019-03-06 14:44 大数据和AI玩出的梗 阅读(987) 评论(0) 推荐(0) 编辑