kaggle比赛心得
参赛历程
比赛时间:3.10-4.11
历时一个多月,无论是知识眼界还是心态方面,都有了较大的改变。刚开始选这个赛题,没有什么特别的地方,顺眼就是了。直到着手准备这个比赛的时候,才发现,事情并不简单,虽然数据集只有训练集和测试集以及一个提交结果的样本,
但是数据没有任何的说明,(数据应该都是从客户那里收集的,所以主办方为了保护客户的隐私,做了脱敏处理)除了ID_code都是数值型的数据,可是它们代表的是什么我们并不知道,这就需要我们不断地画图观察各个特征与标签的相关性,
加上比赛的目的是为了预测客户是否会进行交易,这就需要我们用大量的数据去建立一个适合的模型,我们选择的模型是LGB模型,现在大部分的比赛都会用到lgb,当然xgb,cnn,nn这些模型也是当下比较‘红’的模型。也是带着学习的心态参加这个比
赛,kaggle平台上有很多的专业人士发表含金量高的内核供我们学习,这一点对我们打比赛有着很大的帮助,最后是在公共排行榜上取得了403的成绩,银牌区,总共9038个队伍参赛。
收获:对特征工程和模型融合有了进一步的认识和了解,并且意识到了特征工程的重要性,也接触到了很多python包和功能强大的函数。
心得:做一件事情一定要有始有终,我们在打比赛的第二三周是低谷期,因为准确率始终达不到我们的要求,并且排名也逐渐被刷到九百名开外,后来也是不放弃,有了一次较大的突破,成绩最好的时候直奔82名。充分地认识到了我们和kaggle大
神们的差距,也意味着未来还有很长的一段路要走。继续加油吧,还有头发,还能再学。QAQ