摘要:
一、前序工作流程 1. 数据处理 数据清洗 不可信的样本丢掉 缺省值极多的字段考虑不用 数据采样 下/上采样 保证样本均衡 2. 特征工程 特征处理: 数值型 类别型 时间类 文本型 统计型 组合特征 特征选择: 过滤型 sklearn.feature_selection.Sel 阅读全文
摘要:
一、前言 1.机器学习与特征工程的关联 2.实际工业界的特征工程那些事儿 特征工程 特征 => 数据中抽取出来的对结果预测有用的信息 特征工程是使用专业背景知识和技巧处理数据,使得 特征能在机器学习算法上发挥更好的作用的过程。 意义 更好的特征意味着更强的灵活度 更好的特征意味着只需用简单模型 更好 阅读全文