Spark大规模机器学习学习-开始的开始(数据科学家的开端)
------------------------------------本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢!--------------------------------
一直有想学习和写关于Spark大规模机器学习的东西,最近工作慢慢理顺了很多,终于可以来写关于这部分的内容,一方面激励和监督自己的学习过程,另一方面也记录自己学习历程、方便以后查阅。
内容会分为六条线:
一、机器学习-实战(Python),主要是机器学习实战这本书的学习记录和基本的数据处理流程;
二、Spark学习记录(包括Spark基础+Spark机器学习);
三、edx关于spark的学习笔记;四、最新的一些算法的学习记录,例如deep-learning(Tensor-flow、MXnet代码来自Github分享);
五、关于最新一些趋势和新闻的总结提炼;
六、一些有趣小项目的记录;参考语言主要是python、R、java、scala等,但是希望以后也可以将部分算法用C/C++来实现,最后就可能实际写作中不限于这5条线:)
一、机器学习-实战(Python)(7-9月完成)
二、Spark学习记录(包括Spark基础+Spark机器学习)(不定期更新)
三、edx关于spark的学习笔记(不定期更新)
四、最新的一些算法的学习记录、例如deep-learning(Tensor-flow、MXnet)(不定期更新)
五、关于最新一些趋势和新闻的总结提炼(不定期更新)
六、一些有趣小项目的记录(不定期更新)
资料&闲杂内容