开始机器学习
自从读研以来,给我印象最深的是数学的重要性。本科阶段,一直很疑惑我们学习那些高数、概率统计、线性代数有什么用。有些人甚至认为那些课程都是在浪费时间,说是工作之后根本用不上。的确,在我去企业实习的过程中也很少能够接触到大学学习的数学知识。然而,进入研究生阶段后,陆陆续续读了一些paper,上了一些诸如机器学习、信息检索等课程,这些课程里面涉及大量的数学内容,经过一段时间的学习之后,我会说数学对于计算机科学来说至关重要。如果你读过《数学之美》,那你肯定会赞叹于数学在解决工程问题方面具有如此的魅力。
前段时间,参加了一个在北航办的关于云计算、大数据、移动互联网的高端论坛。这个论坛真的很高端,因为来好多重量级嘉宾,比如中国联通总裁,百度总裁,用友总裁,龙湖地产董事长,微软副总裁。。。现在很多人都在说大数据时代的到来,也都认为大数据存在很珍贵的价值。然而,如何从大数据中获得价值,是一个值得研究的问题。近几年,数据挖掘和机器学习成为了热点技术,它们也是从大数据中获取价值的关键技术。微软的陆奇说,他的团队每个人都必须据说一定的机器学习技能,可见机器学习的重要性。
参加了学校的机器学习课程,老师教得很好。感觉自己渐渐开始了解到底什么是机器学习了,也萌发了很强的研究兴趣。然而,我要说机器学习的水很深,需要很强的数学功底和统计学功底。未来,这方面的技术也肯定会有很大的应用空间,所以,我觉得是时候开设一个分类,用于记录机器学习的学习笔记或是心得。
PS:Matlab是神器,但我更喜欢用python,常用于科学计算的python模块库numpy和scipy。
分享一些好的机器学习的参考书籍:
1、Pattern Recognition And Machine Learning (老师重点推荐的书籍)
2、机器学习 (国内常用的教材)
3、Machine Learning in Action (偏实践、很多代码样例、python)
4、集体智慧编程 (偏实践、很多代码样例、python)