kaggle新手如何在平台学习大神的代码
原创:数据臭皮匠
【导读】Kaggle ,作为听说它很牛X但从未接触过的同学,可能仅仅了解这是一个参加数据挖掘比赛的网站,殊不知Kaggle也会有赛题相关的数据集,
比如我们熟知的房价预测、泰坦尼克号乘客生存预测、手写数字识别等,并且每个比赛下面都会有大神分享自己的思路和代码,如果能利用好这些资源,
一定对我们的学习有所帮助。接下来,就跟我一起入门kaggle吧!
01|Kaggle网址和主界面
Kaggle网址:https://www.kaggle.com
Kaggle的主界面长这样:
02|进入比赛列表
进入主界面后,点击Compete就可以看到比赛列表了,往下划你就可以看到几个我们收悉的比赛
03|查看一个比赛
这里我们举个例子,点击比赛列表中的房价预测项目,进入比赛详情页,你会看到比赛说明、比赛数据以及大神们分享的代码
04|点击Notebooks
点击Notebooks进入大神分享列表
如果你想看人气较高的大神代码,可以通过点击右上角的Hotness按钮,然后选择Most Votes,会为你展示点赞量较高的分享
如果是初学者建议先看第一条分享, 该分享是对房价预测赛题的数据处理,算是数据清洗过程
05|进入一个分享
我们点击进入点赞量最高的分享,往下拉,就可以看到整个代码过程啦
这里分享一下我的学习体会。学习最怕的就是找到Notebook之后,看一遍就关掉了,这样速度虽快,但很快就忘记了。强烈建议你一定要跟着别人的代码动手敲一下,
一行一行的照着敲,敲的多了,你自己就能找到感觉了。只有亲自动手敲代码,执行代码,才能真切体会其中的细节。
06|下载比赛数据集
我们回到比赛详情页菜单栏,点击Data
你会看到数据文件的介绍和数据文件位置
往下翻就可以看到下载按钮了,点击Download All 下载数据
但是需要注册才能下载数据哦,如果注册环节出现问题,请参考本公众号我的另一篇文章《注册Kaggle教程》。你也可以通过本公众号回复"房价预测"直接获取该项目数据集。
07|工具推荐
对于一些早就听说过Kaggle,但是一直没有行动起来的同学,很可能因为它是全英文的网站而止步了。但是我建议你不用因为看不懂英文而放弃,其实笔者的英语水平也有限,很多我也看不明白。你可以借助谷歌翻译,
虽然翻译的不咋滴,但是基本上能够帮助我们搞明白。久而久之,不仅技术提升了,英语水平也上来了。其实最重要的还是坚持。一开始我们学习的进度会很慢,但是对于初学者,这也恰恰提供了一个慢慢消化知识的过程。
还记得我敬佩的一个大牛说过,"越快越慢,越慢越快"。现在我对这句话的体会更加深刻了,也更加认同了。
08|我的分享目的
介绍一条入门路径,不能保证是最优的,最重要的是能够找到一起学习的小伙伴。希望能够帮助未入门的同学先踏进一只脚。也欢迎大家留言给我提建议啊!
另外放上本文的飞书链接,根据读者提出的问题或者对该主题有新的理解,我们会对这篇文章不断完善
长按二维码关注我们的公众号哦