摘要: 这个任务同样是在Jupyter Notebook中完成, 项目目的是通过前面的所有特征列,当然去掉序号列,然后预测最后一列,收入'income',究竟是大于50K,还是小于等于50K. 第一步,探索数据,像探索性统计里经常涉及到的频数,均值,众数或者众位数相关的计算,我们通过这些统计指标,使用pyt 阅读全文
posted @ 2017-05-04 20:11 mining_bw 阅读(1307) 评论(1) 推荐(0) 编辑
摘要: 机器学习,特征工程 阅读全文
posted @ 2017-05-04 17:59 mining_bw 阅读(515) 评论(0) 推荐(0) 编辑