kaggle新手如何在平台学习大神的代码

原创:数据臭皮匠 

【导读】Kaggle ,作为听说它很牛X但从未接触过的同学,可能仅仅了解这是一个参加数据挖掘比赛的网站,殊不知Kaggle也会有赛题相关的数据集,

比如我们熟知的房价预测、泰坦尼克号乘客生存预测、手写数字识别等,并且每个比赛下面都会有大神分享自己的思路和代码,如果能利用好这些资源,

一定对我们的学习有所帮助。接下来,就跟我一起入门kaggle吧!

01|Kaggle网址和主界面

Kaggle网址:https://www.kaggle.com

Kaggle的主界面长这样:

图片

 

02|进入比赛列表

 

进入主界面后,点击Compete就可以看到比赛列表了,往下划你就可以看到几个我们收悉的比赛

图片

 

03|查看一个比赛

 

这里我们举个例子,点击比赛列表中的房价预测项目,进入比赛详情页,你会看到比赛说明、比赛数据以及大神们分享的代码

图片

 

04|点击Notebooks

 

点击Notebooks进入大神分享列表

图片

如果你想看人气较高的大神代码,可以通过点击右上角的Hotness按钮,然后选择Most Votes,会为你展示点赞量较高的分享

图片

图片

如果是初学者建议先看第一条分享, 该分享是对房价预测赛题的数据处理,算是数据清洗过程

 

05|进入一个分享

  

我们点击进入点赞量最高的分享,往下拉,就可以看到整个代码过程啦

图片

这里分享一下我的学习体会。学习最怕的就是找到Notebook之后,看一遍就关掉了,这样速度虽快,但很快就忘记了。强烈建议你一定要跟着别人的代码动手敲一下,

一行一行的照着敲,敲的多了,你自己就能找到感觉了。只有亲自动手敲代码,执行代码,才能真切体会其中的细节。

 

06|下载比赛数据集

 

我们回到比赛详情页菜单栏,点击Data

图片

你会看到数据文件的介绍和数据文件位置

图片

往下翻就可以看到下载按钮了,点击Download All 下载数据

图片

但是需要注册才能下载数据哦,如果注册环节出现问题,请参考本公众号我的另一篇文章《注册Kaggle教程》。你也可以通过本公众号回复"房价预测"直接获取该项目数据集。

 

07|工具推荐

 

对于一些早就听说过Kaggle,但是一直没有行动起来的同学,很可能因为它是全英文的网站而止步了。但是我建议你不用因为看不懂英文而放弃,其实笔者的英语水平也有限,很多我也看不明白。你可以借助谷歌翻译,

虽然翻译的不咋滴,但是基本上能够帮助我们搞明白。久而久之,不仅技术提升了,英语水平也上来了。其实最重要的还是坚持。一开始我们学习的进度会很慢,但是对于初学者,这也恰恰提供了一个慢慢消化知识的过程。

还记得我敬佩的一个大牛说过,"越快越慢,越慢越快"。现在我对这句话的体会更加深刻了,也更加认同了。

 

08|我的分享目的

 

介绍一条入门路径,不能保证是最优的,最重要的是能够找到一起学习的小伙伴。希望能够帮助未入门的同学先踏进一只脚。也欢迎大家留言给我提建议啊!

 

长按二维码关注我们的公众号哦

posted @ 2020-12-28 23:31  数据臭皮匠  阅读(185)  评论(0编辑  收藏  举报