如何做到机器学习竞赛Kaggle排名前2%
摘要:本文详述了如何通过数据预览,探索式数据分析,缺失数据填补,删除关联特征以及派生新特征等方法,在机器学习竞赛Kaggle的Titanic幸存预测这一分类问题竞赛中获得前2%排名的具体方法。
阅读全文
posted @ 2017-04-13 06:53
分享大数据领域技术、包括但不限于Storm、Spark、Hadoop等分布式计算系统,Kafka、MetaQ等分布式消息系统,
MongoDB等NoSQL,PostgreSQL等RDBMS,SQL优化,以及其它前沿技术
posted @ 2017-04-13 06:53
posted @ 2015-04-03 13:59