摘要: 本文是对Kaggle比赛Google Analytics Customer Revenue Prediction的EDA(探索性数据分析)。项目数据量相对较大,两个CSV文件总共超过30GB,对于处理的方法和计算机性能都有一定的要求,且无法通过Public Leaderboard 查看有效排名,对Local CV提出了较高的要求。笔者首次参赛,在多次尝试后,从数据中分析到一些结论,可以用来检查自己的模型。 阅读全文
posted @ 2018-12-12 17:55 Moonfall 阅读(1460) 评论(0) 推荐(1) 编辑
摘要: Python数据分析练习 阅读全文
posted @ 2018-11-02 22:18 Moonfall 阅读(4645) 评论(4) 推荐(0) 编辑