kaggle竞赛入门
我入门是看了范淼和李超的《python机器学习机实践-----从零开始通往Kaggle竞赛之路》
这本书需要掌握python语言,并熟练使用如下python包:pandas numpy matplotlib/seaborn sklearn
pandas是数据处理的一个库,通过http://www.cnblogs.com/chaosimple/p/4153083.html就可以学会个大概
numpy是处理多维数组的一个库,通过http://old.sebug.net/paper/books/scipydoc/numpy_intro.html也能学到个大概
matplotlib可以用来做可视化,通过http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html也能学到大概
我一般使用seaborn做可视化,这个库是matplotlib的高级封装,通过http://blog.csdn.net/qq_34264472/article/details/53814653可以快速入门
https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations这个是seaborn做可视化非常好的例子
sklearn的整体性入门,个人觉得看 范淼和李超的《python机器学习机实践-----从零开始通往Kaggle竞赛之路》就可以了
当然,上面这些都只是入门,要学会融会贯通,查看官网进行系统性学习是必须的;另外就是开始做项目,在看别人的代码,写自己的代码中熟悉各种语法和操作
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------
我学习东西,一般的思路都是先去找学习路径,经常上知乎。。
http://www.cnblogs.com/zhizhan/p/5826089.html这篇文章非常的好
总结下重点,
1,特征工程
目前的机器学习一般把大多数时间都花费在数据处理上(包括特征工程);
数据处理前需要先了解数据的大概,所以需要可视化
https://mp.weixin.qq.com/s/Nt9xKQQZLyWBmU_bMEsbtg这个是讲的比较好的一个例子
2,模型融合
模型融合简单来说就是博采众长,分为bagging boosting stacking等
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------
有了上面的基础就算大概入门了,然后找几个kaggle的例子进行练手,同时看看别人都是怎么玩的
https://www.kaggle.com/kernels这里都是大神,按照各种类别或者自己喜欢的领域边看边写代码
看到下面的神图
参考自http://www.sv-europe.com/crisp-dm-methodology/
拜读起来!!!
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------
我的机器学习之旅,学了spark ml,看了几本理论(差不多忘了),看了公开课(吴恩达的),看了无数的文章,学会了大多数的调优
慢慢的有一种感觉,这玩意还不成熟,总有一天会有一个大一统的模型出来,可以通过网页配置进行特征工程和机器学习调优,最终形成一个平台。
后来,果然看到了一个类似的http://blog.kaggle.com/2016/07/21/approaching-almost-any-machine-learning-problem-abhishek-thakur/
突然感觉,哪天是不是要失业了。。
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
深度学习貌似注重算法一些,为了不失业,感觉得不断丰富自己的武器库。加油加油!!