摘要: 之前在kaggle上做了关于房价预测的比赛,现整理如下。 解决问题的大概步骤是: 1、通过画图查看目标变量SalePrice是否偏分布,若是,则进行log(x+1)变换。并查看数值变量,若偏度大于0.75,也做log(x+1)变换 2、缺失值处理。分类变量NA NA值赋值为0,数值变量中的NA赋值为 阅读全文
posted @ 2017-12-05 09:07 Hyacinth-Yuan 阅读(821) 评论(0) 推荐(0) 编辑