摘要: 在数据的预处理中经常会遇到特征工程,这里做一下笔记。 数据的拼接 特征工程最好针对所有数据,也就是训练集和测试集都要进行特征工程的处理,因此第一步可以是将两个数据集拼接,注意要处理好index的关系。 可以使用pandas的concat函数,如 拼接完后去掉train数据集中的标签值,因为这一项我们 阅读全文
posted @ 2018-06-05 13:54 歪胡子的日常 阅读(1176) 评论(0) 推荐(0) 编辑