摘要: 特征构建是指通过研究原始数据样本,结合机器学习实战经验和相关领域的专业知识,思考问题的潜在形式和数据结构,人工创造出新的特征,而这些特征对于模型训练又是有益的并且具有一定的工程意义。特征构建的方式主要有单列操作、多列操作、 分组/聚合操作这三种。1. 单列操作在pan... 阅读全文
posted @ 2018-09-26 18:58 yucen 阅读(1071) 评论(0) 推荐(0) 编辑
摘要: 机器学习实战的特征工程主要包含数据预处理、特征构建、特征选择三步,首先来介绍数据预处理。我选择python作为工具,并将主要用到pandas、numpy等数据工具库。加载库:import pandas as pdimport numpy as np1. 观察数据(1)... 阅读全文
posted @ 2018-09-26 11:00 yucen 阅读(313) 评论(0) 推荐(0) 编辑