【经验分享】我经历的几门MOOC

这半年来,从1月初到6月底,在coursera上注册了4们有关数据分析/挖掘的课程。这些课程都是利用业余时间学习,每周基本上花5个小时左右。其中通过了3门,注销了一门。感觉还是学到了一些东西。

第一门课程 Computing for Data Science,2013年1月2日开课,为期4周。本课程主要是学习编程语言R---一种数据分析语言和环境,学完后可以用R完成基本分析任务,但一些高级的数据可视化掌握得不熟练,需要后面巩固。

第二门课程 Data Analysis,2013年1月22日开课,为期8周。这门课程与上门课程配套的,主要用R进行一些数据分析。主要的理论是统计学,什么概率,抽样,统计,正太分布,置信区间,假设检验呀,线性回归,决策树,随机深林等。课程中有两个peer review作业(我最喜欢的部分),需要按照要求对两个问题进行分析,然后输出分析报告。第一个问题是分析LeadingClub(美国的一家P2P借贷平台)的借贷利率的制订方式,这个任务是在过年期间完成的,所以过年除开走亲戚的时间,基本上都耗在这上面了,不过还是值得的,这个过程学到了很多东西。这个问题用线性回归可以轻松解决。第二个问题分析三星手机收集的用户行为数据,预测用户的行为(走,坐,站,上楼,下楼等)。也是要输出一份分析报告,使用决策树和随机森林可以搞定。我很喜欢Coursera上的Peer Review的学习方式,因为这样可以知道其他人对同样一个问题的看法,达到交流和沟通的目的,review的过程也是一种学习的过程,所以我总是将那些我认为回答的很好的报告保留,作为以后的参考。

第三门课程 (Web Intelligence and Big Data,2013年4月26日开始,为期12周)和第四门(Introduction to Data Science,2013年5月1日开始,为期8周)内容有点重复,主要是讲数据分析/挖掘在大数据(MR,NoSQL,HDFS)技术上的应用。但是第三门课程讲的太抽象,而且作业大多数都是选择题,感觉没有意思,后来注销了。第四门课程作业设置自比较合理,全部都是数据分析或者编程这种主观作业,而且还结合了实际问题---可选的real world project和aws上的nosql作业。课程还介绍了一个竞赛平台kaggle,而且有一个作业是参加这个平台中额一个竞赛,在这个作业的peer review中,我得了慢分。这个平台与以往的ACM竞赛平台不同。它上面的问题都是实际问题,解决方案会给相关企业带来直接的利益,而且有些问题还会给优秀的解决方案提供奖金(虽然不多)。后续会继续关注和参加比赛,历练自己。

总结经验:Coursera上面的课程有时间限制,建议同时不要学习多门课程,尤其是平时还有很多工作,当时学习第三和第四们课程时,时间有重叠,感觉吃不消,所以果断注销了第三门课程,最后顺利完成了第四们课程。

posted @ 2013-10-14 12:52  bourneli  阅读(1282)  评论(0编辑  收藏  举报