摘要: 1.数据可视化 1.单变量可视化 参考:从kaggle房价预测看探索性数据分析的一般规律 查看pandas某列的统计指标 # 描述性统计 print(train_data['SalePrice'].describe()) count 1460.000000 # 行数 mean 180921.1958 阅读全文
posted @ 2016-12-23 15:34 tonglin0325 阅读(7146) 评论(0) 推荐(1) 编辑
摘要: 特征缩放(Feature Scaling)是一种将数据的不同变量或特征的方位进行标准化的方法。 在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲(数量级)的纯数值,便于不同单位或量级的指标能够进行比较和加权。 特征缩放的好处: 参考:标准化的好处及常见处理方法 1. 提升 阅读全文
posted @ 2016-12-23 14:58 tonglin0325 阅读(598) 评论(0) 推荐(0) 编辑