ML - 一些路径

初见

一些课程

Andrew Ng的网络课程

Andrew Ng的机器学习课程

莫烦

HomePage:https://morvanzhou.github.io/
网易云课堂:https://study.163.com/provider/1111519/index.htm
GitHub:https://github.com/MorvanZhou/
推荐学习顺序:https://morvanzhou.github.io/learning-steps/

100-Days-Of-ML-Code

台大李宏毅的课程

一些书目

《Machine Learning Yearning》

来自Andrew Ng的免费AI技术指南

《DeepLearning》

是一本皆在帮助学生和从业人员进入机器学习领域的教科书,以开源的形式免费在网络上提供,因图书封面为杜鹃花景色,俗称“花书”;

关于花书的经验法则:

阅读建议:
- 为了补充基础可以阅读第1-5章,其中也包含了一些数学知识;
- 只关注主流神经网络知识可以阅读6-10章,介绍了DNN/CNN/RNN;
- 需要进一步了解一些调参和应用技巧,推荐阅读11和12章;
- 第13-20章为进阶章节,在入门阶段没有必要阅读;
- 按章节阅读耗时耗力的,建议的做法是吴恩达的课程讲到什么概念,到这本书里面可以相应阅读来理解,

《机器学习》

  • 豆瓣读书:https://book.douban.com/subject/26708119/
  • 因图书封面为西瓜图案,俗称“西瓜书”。
  • 大而全的书籍,因为篇幅的限制,涵盖了很多的内容但无法详细讲解,对于零基础的初学者实际阅读难度很大。
  • 阅读建议:将其作为参考书而不是主力阅读书,在入门阶段只阅读前十章即可。

pumpkin-book

南瓜书来源于西瓜书,由 开源组织Datawhale 发起,将西瓜书中1-7章节的公式进行了整理,对西瓜书中难点公式进行了详解,有跳跃性的公式进行了补充
南瓜书是西瓜书的公式推导版,里面的内容都是以西瓜书的内容为前置知识进行表述,所以南瓜书的最佳使用方法 是以西瓜书为主线,遇到自己推导不出来或者看不懂的公式时再来查阅南瓜书。

一些建议

1- 直接从主干和核心内容开始

机器学习涉及概率论、线性代数、计算机、神经科学等多方面,很多内容对初学者而言,晦涩难懂,过程极其枯燥。
如果从最底层的理论知识开始学起,试图补全知识结构,将耗费大量时间,造成“懈怠学习”,容易半途而废。
不要试图将八成的时间来啃这两成的内容,它们不是实际应用中需要重点了解的部分。
你的业务需求和应用目标对应着学习的路径、要达到的实际应用水平。
如果不是想成为“优化大师”,那么只需要将这些基础理论知识当做工具,而不是目的。
建议:不要试图掌握所有相关理论知识再开始学习,而是应该在学习和使用的过程中,哪里不会补哪里,这样更有目的性且耗时更低。

2- 搭建一个简单的运行环境和模型

作为初学者,最好先从顶层框架上有个大概性的系统认识,然后再从实践到理论,在实际学习和应用的过程中,有的放矢的查缺补漏知识点。
从宏观到微观,从整体到细节,更有利于机器学习快速入门。
建议:从独立搭建一个简单的回归模型开始,从实际案例中获取直观体验,更能激发学习积极性。

3- 不要收集过多的资料

过多的资料,很多时候会让绝大多数人产生“自我安慰和欺骗”的错觉:“感觉良好”,“以后一定会好好学习,取得进步”。
繁杂的内容,则会让人容易陷入到一种迷茫和焦虑的状态。
建议:避免单纯的“信息收集”,贪多嚼不烂,不仅浪费精力而且分散注意力,最终真正有效的信息往往是“少而精”的。

4- 分辨信息的局限性

机器学习的发展和变化速度很快,相关信息爆发性增长的同时,这些信息往往时效性也很强。
很少有信息永远是对的,信息的价值都是放在“某个标准和环境”之下才得以体现,只适用于特定环境和某个时期。
因此在使用这些信息时,最重要的就是独立思考、去伪存真的能力,不要急着全盘接受,也不要因为“没有眼缘”而全盘否定。
建议:避免过时的“大部头”资料,而是应该选择“小而新”的,例如:购买最近三年以内出版且口碑良好的书籍、查看官网最新信息等。

5- 有效的投入与坚持

如果说以上几条是技巧性的学习方法,那么这一条则是对初学者唯一的硬性要求。
有目的,讲方法,别蛮干,可以尝试着与自身的工作经历结合起来。
对特定领域的深刻理解往往就是捅破窗户的那最后一层纸,只理解模型但不了解数据和数据背后的意义,导致很多机器学习模型只停留在好看而不实用的阶段。
通过跨领域完全可以做到曲线救国,化劣势为优势,可能比只懂机器学习的人有更大的行业价值。
机器学习没有那么高不可攀,没有必要放弃自己的本专业全职转行,沉没成本太高。

关于数学

  • 线性代数:矩阵以及计算、线性变换、SVD(Singular Value Decomposition,奇异值分解)
  • 概率论与数理统计:概率基础、随机向量与分布、总体/样本参数估计、随机过程与采样
  • 其它数学知识点:梯度、一阶二阶导数、微积分、数值计算与优化

一些资源

笔记

汇总

算法

GitHub札记

- MLEveryday/100-Days-Of-ML-Code
- scutan90/DeepLearning-500-questions
- fengdu78/deeplearning_ai_books
- fengdu78/Coursera-ML-AndrewNg-Notes
- https://github.com/apachecn/
- apachecn/AiLearning
- apachecn/python_data_analysis_and_mining_action 
- MorvanZhou/Tensorflow-Tutorial
  • MorvanZhou/tutorials
posted @ 2018-12-25 00:21  Anliven  阅读(664)  评论(0编辑  收藏  举报