机器学习:入门建议及免费学习资源
对于大多数人来说,重新回到学校去研究机器学习已经不现实了。好在可以自学,这篇文章就是写给希望通过自学进入机器领域的你们的。
首先我有两个基本的建议:
1. 先打好基础,然后再专攻感兴趣的领域
你不可能深入机器学习领域的每一个话题。有太多要学的东西,并且这个领域发展的很快。因此我的建议是,你先掌握一些基础概念,然后专注在你兴趣的领域 -- 无论是自然语言理解、计算机视觉、深度强化学习、机器人,还是任何其它东西。
2. 围绕最感兴趣的话题设计你的学习科目
对于长期学习或者作为一项事业来说,动机远比学习策略重要。如果你感兴趣,就会进展较快。如果你是被迫学习,进展就会慢。
编程学习
语法和基础概念:
-
谷歌的 Python 课程:https://developers.google.com/edu/python/
-
笨办法学 Python:https://learnpythonthehardway.org/book/ex0.html
练习:
-
CoderByte:https://coderbyte.com/
-
CodeWars:https://coderbyte.com/
-
HackerRank:https://www.hackerrank.com/
线性代数
-
《深度学习》书的第二章《线性代数》
网址:http://www.deeplearningbook.org/contents/linear_algebra.html
这本书是特别针对机器学习相关的线性代数概念的快速概览。
-
《线性模型理论的第一堂课》
网址:https://www.amazon.com/First-Course-Linear-Model-Theory/dp/1584882476
Nalini Ravishanker 和 Dipak Dey 所著。在统计学语境下介绍线性代数的教科书。
概率统计
-
《概率统计导论》
网址:https://ocw.mit.edu/courses/mathematics/18-05-introduction-to-probability-and-statistics-spring-2014/index.htm
Jeremy Orloff 和 Jonathan Bloom 讲授。帮你建立概率推理和统计推断方面的直觉,对于理解机器如何思考、规划、和决策来说,它是无价之宝。
-
《统计大全:关于统计推断的短期课程》
网址:http://www.ic.unicamp.br/~wainer/cursos/1s2013/ml/livro.pdf
Larry Wasserman 所著。统计学的导论性教科书。
微积分
-
《可汗学院:微分》或者任何微积分方面的课程或课本
网址:https://www.khanacademy.org/math/calculus-home/differential-calculus
-
《斯坦福 CS231n:导数,反向传播和向量化》
网址:http://cs231n.stanford.edu/handouts/derivatives.pdf
由Justin Johnson 讲授。
机器学习
-
《吴恩达的机器学习课程》
网址:https://www.coursera.org/learn/machine-learning
更严格来说,这是斯坦福的课程 CS229。
-
数据科学集训班Galvanize
网址:https://www.galvanize.com/san-francisco/data-science
全日制,三个月,较贵
-
数据科学集训班Thinkful
网址:https://www.galvanize.com/san-francisco/data-science
时间灵活,六个月,较便宜
-
《统计学习导论》
网址:http://www-bcf.usc.edu/~gareth/ISL/
Gareth James 等人所著。机器学习核心概念的优秀参考书,免费。
深度学习
-
Deeplearning.ai:
网址:http://deeplearning.ai/
吴恩达的深度学习入门课程。
-
CS231n:用于视觉识别的卷积神经网络
网址:http://cs231n.stanford.edu/syllabus.html
斯坦福的深度学习课程。有助于打好基础,讲义做的很好,也包含用于演示的问题集。
-
Fast.ai
网址:http://fast.ai/
基于项目的课程,有趣。项目包括阿猫阿狗的图像分类和自动生成尼采哲学作品。
-
使用 TensorFlow 分类 MNIST 手写数字
网址:https://codelabs.developers.google.com/codelabs/cloud-tensorflow-mnist/#0
这个来自 Google 的教程,可以让你在三个小时里搞定手写数字识别,并且达到超过 99% 的准确率,。
-
Kaggle 竞赛
网址:https://www.kaggle.com/
使用 Github 上的其它版本作为参考资料,来动手实现你感兴趣的深度学习论文中的算法。
-
《深度学习》
网址:http://www.deeplearningbook.org/
深度学习领域的圣经,大牛Ian Goodfellow,Yoshua Bengio 和 Aaron Courville 所著。
-
《神经网络和深度学习》
网址:http://neuralnetworksanddeeplearning.com/chap1.html
思路清晰的深度学习教程,Michael Nielsen 所著。以一些实现了人类级别的智能应用收尾。
-
深度学习论文阅读路线图,关键论文的全集,按照时间和研究领域组织。
强化学习
-
CS294:深度强化学习
网址:http://rll.berkeley.edu/deeprlcourse/
John Schulman 在伯克利的课程
-
强化学习
网址:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html
伦敦大学学院,David Silver 授课。
-
深度强化学习训练营
网址:https://www.deepbootcamp.io/
由 OpenAI 和 伯克利(UCB) 组织。当前处于关闭状态,但是值得期待未来的课程。
-
Pong from Pixels
网址:http://karpathy.github.io/2016/05/31/rl/
来自Andrej Karpathy 的实战教程。从零开始,在 130 行代码之内,实现打乒乓球的智能体。
-
基于Tensorflow的 简明强化学习教程
网址:https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part-0-q-learning-with-tables-and-neural-networks-d195264329d0
来自Arthur Juliani ,使用 TensorFlow 实现 Q-learning, policy-learning 和 actor-critic 和探索策略。
-
OpenAI 的 requests for research
网址:https://openai.com/requests-for-research/
可以到这里查看更多的深度学习项目方面的IDEA。
-
《强化学习导论》
网址:http://people.inf.elte.hu/lorincz/Files/RL_2006/SuttonBook.pdf
作者是Richard Sutton。
人工智能
-
人工智能:一种现代方法
网址:http://aima.cs.berkeley.edu/
由 Stuart Russell 和 Peter Norvig 所著。
-
人工智能导论
网址:https://www.udacity.com/course/intro-to-artificial-intelligence--cs271
Sebastian Thrun 的优达学城课程
-
Insight AI 伙伴计划(http://insightdata.ai/)
-
谷歌大脑实习项目(https://research.google.com/teams/brain/residency/)。
人工智能安全
简明版请阅读:
-
人工智能的风险(https://thinkingwires.com/posts/2017-07-05-risks.html)
-
OpenAI 和 谷歌大脑的合作:AI 安全中的具体问题(https://blog.openai.com/concrete-ai-safety-problems/)
-
AI 的进化(https://waitbutwhy.com/2015/01/artificial-intelligence-revolution-1.html)。
详细版请查看Nick Bostrom 的超智能(https://www.amazon.com/Superintelligence-Dangers-Strategies-Nick-Bostrom/dp/0198739834)。
-
MIRI (https://intelligence.org/research/)发布的 AI 安全方面的研究
-
FHI(https://www.fhi.ox.ac.uk/research/research-areas/) 发布的 AI 安全方面的研究
-
Reddit 上的 ControlProblem频道(https://www.reddit.com/r/ControlProblem/)。
时事通讯
-
Import AI
网址:https://jack-clark.net/import-ai/
每周 AI 通讯,涵盖业界的最新发展。由 OpenAI 的 Jack Clark 筹划。
-
Machine Learnings
网址:https://machinelearnings.co/
由 Sam DeBrule 筹划。和这个领域中的专家互动频繁。
-
Nathan.ai
网址:http://nathan.ai/
涵盖近期新闻,和风投视角的 AI/ML 评论。
-
The Wild Week in AI
网址:https://www.getrevue.co/profile/wildml
由 Denny Britz 维护。标题说明了一切。
来自其他人的建议
-
不上任何在线课程的情况下,学习机器学习的最佳方式是什么?
网址:https://www.forbes.com/sites/quora/2017/03/22/what-is-the-best-way-to-learn-machine-learning-without-taking-any-online-courses/#30fc6e5d5d87
由谷歌大脑的 Eric Jang 回答。
-
作为工程师,什么是修炼深度学习技能的最佳方式?
网址:https://www.quora.com/What-are-the-best-ways-to-pick-up-Deep-Learning-skills-as-an-engineer
由 OpenAI 的 CTO Greg Brockman 回答。
-
A16z 的 AI 攻略书
网址:http://aiplaybook.a16z.com/
更加偏代码向的介绍。
-
AI 安全大纲
网址:https://80000hours.org/ai-safety-syllabus/
由 80,000 Hours 设计。
原文:The Best Machine Learning Resources