(转) 机器学习与数据挖掘网上资源搜罗——良心推荐
原文地址:http://blog.csdn.net/baimafujinji/article/details/50467970
前面我曾经发帖推荐过网上的一些做“图像处理和计算机视觉的”有料博客资源,原帖地址
图像处理与机器视觉网络资源收罗——倾心大放送
http://blog.csdn.net/baimafujinji/article/details/32332079
做机器学习和数据挖掘方面的研究和开发,常会在线搜索一些资源,日积月累便挖出了一堆比较牛的博主,特别说明:做这个方向的人很多,牛人也很多,但是这些资源大部分主要突出实用主义,相关博主也并不一定是这个领域中的泰山北斗(至少大部分都不是学校里的教授),但是他们的空间里真的有料,可以学到很多。不断更新中,但大浪淘沙,我只保留最值得推荐的。
1、首先,是豆瓣上的数据铺子主页
http://site.douban.com/182577/
因为我个人多是用R来做数据挖掘和分析,所以主页菌的内容很对我的胃口。这个主页里有大量用R做数据挖掘的内容。我也向博主偷师了很多。尽管主页菌已经停止更新内容了,但是现有的部分(其实文章量很大)已经可以令后来者学到很多了。
2、JerryLead在博客园上的主页
http://www.cnblogs.com/jerrylead/
如果你想了解数据挖掘算法的原理,而且是从数学层面上做到“知其然,更知其所以然”的深度理解,这个博客(以及下面的博客)理应是你必看的内容。这个主页的特点是对很多算法都做了详细的数学推导。博主应该是在中科院读博的,尽管博客似乎也停更很久了,但是很多经典的东西其实永不过时。SVM、EM等系列文章介绍的很到位,尤其推荐。
3、pluskid的主页
http://blog.pluskid.org/?page_id=683
博主是浙大本硕,后来貌似应该去了美国读博。这个博客跟JerryLead的很类似,大量数学推导,让你从本质上认识和理解很多晦涩的数据挖掘算法。网络上很多人推崇CSDN上的July,尤其是那篇SVM三重境界。殊不知,July的三重境界也不过是JerryLead和pluskid左一段右一段的移花接木之作罢了。最开始我看这几篇文章的时候,就发现内容像极了,尤其是pluskid画的图基本原模原样地出现在了July的文章中。后来在知乎上看了帖子http://www.zhihu.com/question/24957182,差不多也就明白里面的事了。总之,希望大家还是能够尊重原创吧。July的博客也可以看,毕竟超千万的访问量,他东搜西凑的不断整理没有功劳也有苦劳,大家可权当一个合集来看了。
4、龙心尘&寒小阳 的主页
http://blog.csdn.net/longxinchen_ml/
数据挖掘和机器学习博客中的新生力量,看了几篇博文,感觉实力不俗。神经网络和深度学习部分的内容比较推荐。
其他公共资源
R、Weka、Python和Matlab都是用来做数据挖掘的利器(甚至SPSS、STATA、SAS也能用来完成一些数据挖掘任务)。因此,事实上这些软件或语言的公共主页或论坛上也包含有大量不错的内容(包括一些程序代码和应用实例)。
最后,网上还有很多关于机器学习和数据挖掘的公开课。如果你想一点一点系统的学习,那么这些资源你都不应该错过。我主要推荐两个:
一个是斯坦福的公开课——机器学习 ,由Andrew Ng主讲。我相信JerryLead 的EM博文就参考了Andrew Ng的授课内容。这个课程是英文授课,国内网站的视频上还配了中文字幕,如果你有毅力和决心,那么啃这个课程是很不错的选择。国内可以访问网易公开课来学习,地址如下
http://open.163.com/special/opencourse/machinelearning.html
如果你还是觉得听英语很别扭,那么由台湾大学林轩田教授录制的中文Coursera课程(也就是传说中的MOOC)——机器学习系列就是一个绝佳的资源。该课程分上下两个部分,对于初学者可以学习——“机器学习基石”课程
http://c.open.163.com/coursera/courseIntro.htm?cid=938
听这个名字你也能知道上面的课程讲的是基础。如果你想学习进阶内容(当然,前提是基石部分的知识你已经统统掌握了),那么你便可以选择林教授的另外一门MOOC课程——“机器学习技法”课程
http://c.open.163.com/coursera/courseIntro.htm?cid=1664
最后,感谢上述资源提供者的无私奉献。也衷心希望各位读者学有所得,学有所成!