ML - 一些路径
初见
一些课程
Andrew Ng的网络课程
- HomePage:http://www.deeplearning.ai/
- 网易云课堂(中文翻译版):https://mooc.study.163.com/smartSpec/detail/1001319001.htm
Andrew Ng的机器学习课程
- coursera:https://www.coursera.org/learn/machine-learning
- 网易云课堂:https://study.163.com/course/introduction/1004570029.htm
- 启蒙课程,目的是让初学者能够快速对整个机器学习知识点有比较整体的认识,便于快速入门。
- 难度适中且完全免费,提供中文字幕,完成时间大约为55小时,课程中没有复杂的公式推导和理论分析。
- 基本涵盖了机器学习的主要知识点,例如:线性回归、逻辑回归、支持向量机、神经网络、K-Means、异常检测等等。
- Python版演示教学示例:https://github.com/mstampfer/Coursera-Stanford-ML-Python
- 中文笔记及作业代码:https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
- 所有知识点的思维导图:https://pic1.zhimg.com/v2-2b979310ac6c053b9a96a1e594824934_r.jpg
莫烦
HomePage:https://morvanzhou.github.io/
网易云课堂:https://study.163.com/provider/1111519/index.htm
GitHub:https://github.com/MorvanZhou/
推荐学习顺序:https://morvanzhou.github.io/learning-steps/
- Tutorials:https://github.com/MorvanZhou/tutorials
- 有趣的机器学习:https://morvanzhou.github.io/tutorials/machine-learning/ML-intro/
- 机器学习系列讲解:https://morvanzhou.github.io/tutorials/machine-learning/
100-Days-Of-ML-Code
- EN:https://github.com/Avik-Jain/100-Days-Of-ML-Code
- CN:https://github.com/MLEveryday/100-Days-Of-ML-Code
台大李宏毅的课程
- 机器学习2017 - 观看地址:http://t.cn/RpO3VJC
- 机器学习2017 - 网易云课堂:https://study.163.com/course/introduction/1208946807.htm
- 深度学习2017 - 观看地址:http://t.cn/RpO3VJK
- 深度学习2017 - PPT
- 资料:http://speech.ee.ntu.edu.tw/~tlkagk/courses.html
一些书目
《Machine Learning Yearning》
来自Andrew Ng的免费AI技术指南
- 原书官网:http://www.mlyearning.org/
- 中文翻译:https://github.com/AcceptedDoge/machine-learning-yearning-cn/
- 项目地址:https://github.com/xiaqunfeng/machine-learning-yearning
- 书籍地址:https://xiaqunfeng.gitbooks.io/machine-learning-yearning/content/
《DeepLearning》
是一本皆在帮助学生和从业人员进入机器学习领域的教科书,以开源的形式免费在网络上提供,因图书封面为杜鹃花景色,俗称“花书”;
- 英文在线版:http://www.deeplearningbook.org/
- Deep Learning 中文版:https://github.com/exacity/deeplearningbook-chinese
- Deep Learning 中文版下载地址:https://github.com/exacity/deeplearningbook-chinese/releases
- 在线阅读(注意由于版权问题,在线版本不提供图片):https://exacity.github.io/deeplearningbook-chinese/
- 精炼笔记目录:https://zhuanlan.zhihu.com/p/38431213
关于花书的经验法则:
- 中文版:https://mp.weixin.qq.com/s/4Ah_ylgJ2jZpAFyaqtEX6Q
- 英文版:https://jeffmacaluso.github.io/post/DeepLearningRulesOfThumb/
阅读建议:
- 为了补充基础可以阅读第1-5章,其中也包含了一些数学知识;
- 只关注主流神经网络知识可以阅读6-10章,介绍了DNN/CNN/RNN;
- 需要进一步了解一些调参和应用技巧,推荐阅读11和12章;
- 第13-20章为进阶章节,在入门阶段没有必要阅读;
- 按章节阅读耗时耗力的,建议的做法是吴恩达的课程讲到什么概念,到这本书里面可以相应阅读来理解,
《机器学习》
- 豆瓣读书:https://book.douban.com/subject/26708119/
- 因图书封面为西瓜图案,俗称“西瓜书”。
- 大而全的书籍,因为篇幅的限制,涵盖了很多的内容但无法详细讲解,对于零基础的初学者实际阅读难度很大。
- 阅读建议:将其作为参考书而不是主力阅读书,在入门阶段只阅读前十章即可。
pumpkin-book
南瓜书来源于西瓜书,由 开源组织Datawhale 发起,将西瓜书中1-7章节的公式进行了整理,对西瓜书中难点公式进行了详解,有跳跃性的公式进行了补充
南瓜书是西瓜书的公式推导版,里面的内容都是以西瓜书的内容为前置知识进行表述,所以南瓜书的最佳使用方法 是以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书。
- GitHub项目链接:https://github.com/datawhalechina/pumpkin-book
- 在线阅读地址:https://datawhalechina.github.io/pumpkin-book/
一些建议
1- 直接从主干和核心内容开始
机器学习涉及概率论、线性代数、计算机、神经科学等多方面,很多内容对初学者而言,晦涩难懂,过程极其枯燥。
如果从最底层的理论知识开始学起,试图补全知识结构,将耗费大量时间,造成“懈怠学习”,容易半途而废。
不要试图将八成的时间来啃这两成的内容,它们不是实际应用中需要重点了解的部分。
你的业务需求和应用目标对应着学习的路径、要达到的实际应用水平。
如果不是想成为“优化大师”,那么只需要将这些基础理论知识当做工具,而不是目的。
建议:不要试图掌握所有相关理论知识再开始学习,而是应该在学习和使用的过程中,哪里不会补哪里,这样更有目的性且耗时更低。
2- 搭建一个简单的运行环境和模型
作为初学者,最好先从顶层框架上有个大概性的系统认识,然后再从实践到理论,在实际学习和应用的过程中,有的放矢的查缺补漏知识点。
从宏观到微观,从整体到细节,更有利于机器学习快速入门。
建议:从独立搭建一个简单的回归模型开始,从实际案例中获取直观体验,更能激发学习积极性。
3- 不要收集过多的资料
过多的资料,很多时候会让绝大多数人产生“自我安慰和欺骗”的错觉:“感觉良好”,“以后一定会好好学习,取得进步”。
繁杂的内容,则会让人容易陷入到一种迷茫和焦虑的状态。
建议:避免单纯的“信息收集”,贪多嚼不烂,不仅浪费精力而且分散注意力,最终真正有效的信息往往是“少而精”的。
4- 分辨信息的局限性
机器学习的发展和变化速度很快,相关信息爆发性增长的同时,这些信息往往时效性也很强。
很少有信息永远是对的,信息的价值都是放在“某个标准和环境”之下才得以体现,只适用于特定环境和某个时期。
因此在使用这些信息时,最重要的就是独立思考、去伪存真的能力,不要急着全盘接受,也不要因为“没有眼缘”而全盘否定。
建议:避免过时的“大部头”资料,而是应该选择“小而新”的,例如:购买最近三年以内出版且口碑良好的书籍、查看官网最新信息等。
5- 有效的投入与坚持
如果说以上几条是技巧性的学习方法,那么这一条则是对初学者唯一的硬性要求。
有目的,讲方法,别蛮干,可以尝试着与自身的工作经历结合起来。
对特定领域的深刻理解往往就是捅破窗户的那最后一层纸,只理解模型但不了解数据和数据背后的意义,导致很多机器学习模型只停留在好看而不实用的阶段。
通过跨领域完全可以做到曲线救国,化劣势为优势,可能比只懂机器学习的人有更大的行业价值。
机器学习没有那么高不可攀,没有必要放弃自己的本专业全职转行,沉没成本太高。
关于数学
- 线性代数:矩阵以及计算、线性变换、SVD(Singular Value Decomposition,奇异值分解)
- 概率论与数理统计:概率基础、随机向量与分布、总体/样本参数估计、随机过程与采样
- 其它数学知识点:梯度、一阶二阶导数、微积分、数值计算与优化
一些资源
笔记
- 机器学习笔记:https://feisky.xyz/machine-learning/
- Python机器学习在线指南(教程和代码):https://mp.weixin.qq.com/s/7RSz1AFHjxFxe-j0Ili6Ng
汇总
- 机器学习资源大全中文版 - Python:https://github.com/jobbole/awesome-machine-learning-cn#python
- 完备的AI学习路线,最详细的中英文资源整理:https://mp.weixin.qq.com/s/dI0im1AZmwrFQCO2uWiXXg
算法
- 开源的《AI 算法工程师手册》在线阅读地址:http://www.huaxiaozhuan.com/
- ML算法工程师知识点及概念指南:https://github.com/imhuay/Algorithm_Interview_Notes-Chinese
GitHub札记
- MLEveryday/100-Days-Of-ML-Code
- scutan90/DeepLearning-500-questions
- fengdu78/deeplearning_ai_books
- fengdu78/Coursera-ML-AndrewNg-Notes
- https://github.com/apachecn/
- apachecn/AiLearning
- apachecn/python_data_analysis_and_mining_action
- MorvanZhou/Tensorflow-Tutorial
- MorvanZhou/tutorials
行动是绝望的解药!
欢迎转载和引用,但请在明显处保留原文链接和原作者信息!
本博客内容多为个人工作与学习的记录,少数内容来自于网络并略有修改,已尽力标明原文链接和转载说明。如有冒犯,即刻删除!
以所舍,求所得,有所获,方所成。