机器学习入坑指南(七):机器学习的知识结构
互联网的浪潮席卷全球,它功成名遂,高处不胜寒,一览众山小。然而时代的弄潮儿不会止步于此,他们还要站在新的浪潮之巅,去征服更大的世界。
一、前言:为何要学习机器学习
我不知道下一个风口到底是什么,但我相信人工智能、虚拟现实、区块链,至少有一种将重塑我们的未来。
经过数十年的发展,机器学习被认为是人工智能中最成熟、应用最广泛、成果最令人振奋的一环。人们对人工智能的遐想通常是拥有独立思维的人型机器,这从各个层面上来看都任重而道远。但机器学习带来的好处已经十分实在——语音/图像识别、人脸识别、智能推送(虽然很烦),以及日趋成熟的自动驾驶。
也许大家对铺天盖地的人工智能培训广告感到厌倦,对广告上诱人的高价薪酬半信半疑,但只要你用心学习一段机器学习,你就会发现它的魅力所在。互联网时代积累下来浩瀚的原始数据,我们需要一种强有力的工具去挖掘它们的价值,这种工具,或许正是打开新世界大门的钥匙。每一个技术人都不希望自己被淘汰,也许机器学习的知识不能帮你找到工作,但却是一张入场券。
据我所知,目前 AI 行业的门槛仍然较高,短期甚至有供过于求的情况。但互联网行业的发展也同样经历过这个时期。等到它真正爆发的时候再去入坑,其实已经晚了。二十年前一个学历普通的年轻人决定进入 IT 行业,只需要稍微培训一下甚至是自学一段时间就能进大厂,而且可能已经成为了行业大牛,但在今天想复制同样的成功却十分困难。为什么股市里那么多韭菜?牛市一窝蜂进去,熊市一窝蜂出来,止跌不止盈,高买低卖。也许道理我们都懂,但这是人性的弱点,我体会过,很难克服,所以,成功的永远只是少数人。
如果你只是为了找工作,想花费一两个月时间(甚至还坚持不了)去学机器学习,那还是放弃吧。如果我是公司老板,这个行业我不会冒险,直接从高学历应届毕业生里找人成本才是最低的。
如果你想真正掌握这门技术,Welcome to Westworld!
二、知识结构分析
下图是根据《机器学习实战》一书制作的思维导图,我们可以利用它来分析一下机器学习的知识结构。
图中,用红色星星标注的是前期需要重点学习的内容,也是比较通用的部分。绿色的饼状图代表我对特点知识的理解程度。
我想,这个结构比我们接触过的大部分学科都要简单。所以没有必要因为高大上的名字就产生畏难情绪。甚至可以再进一步将其简化为“回归”和“分类”两大部分。也许将来还会有“极简机器学习手册”之类的书籍诞生吧,谁知道呢。
书中按顺时针顺序组织章节内容,我觉得是 OK 的。
1 机器学习基础部分
机器学习需要什么先导知识呢?
本科正常毕业水平的线性代数、概率论,和一点点计算机知识即可。
忘了的知识可以复习,真遇到不懂的上网查查就好了。至于编程,由于有 Python 这样的语言在,只需要花费很少的时间(一周以内),就能从 0 开始读懂程序。如果你有任何一门语言的基础,那么根本不用单独花时间学 Python,遇到看不懂的语法直接搜索就完了。
2 分类
分类分为监督分类和非监督分类,又各自有不同的方法。
监督分类,如图所示,大致就是 KNN、决策树、贝叶斯、逻辑回归、SVM,其中 SVM 相对复杂点,其它的很容易理解。
非监督分类,主要就是聚类和密度估计。
3 回归
回归即定量的分析或预测。包括线性回归(简单线性回归和多元线性回归)和树回归。这部分的模型也很好理解。
关于回归和分类的区别,举个例子:
预测明天下不下雨,属于分类问题;
预测明天的降雨量,属于回归问题。
4 研究方向
其一,是寻找新的分类与回归问题的算法。
其二,是如何改进已有的算法,提高他们的准确度与运算效率。
其三,是研究如何把机器学习与实际应用更好地结合。
对于不打算走算法路线的同学们,只要不断跟进新的成果,并尝试去应用它们就足够了,把机器学习当做一个强有力的工具即可。
三、学习路径与资料分享
1 学习路径
其实刚才的结构分析中已经体现出来了。我的学习路径是这样的:
机器学习是什么 -> 线性回归 -> 逻辑回归 -> SVM -> 线代 -> KNN -> 贝叶斯 -> 决策树 ...
各个算法的学习顺序无所谓,一个一个攻克即可。先把基础的学下来,并动手写代码实践,再尝试去改进它。
数学基础不用担心!!!
编程不用担心!!!
找不到对象完全不用担心!!!
2 学习资料
最后给大家推荐一些学习资料。
[1] GitHub - Avik-Jain/100-Days-Of-ML-Code,一个小哥分享的学习笔记与实践代码,时间比较充裕的学生党可以按照他每日的进度学习。
[2] 网盘 - 一些参考书籍与视频教程,提取密码:dnxs。是大佬分享给我的,内容很多,大家各取所需。
[3] MIT 的线代教程 ,公认的好课。需要补线代知识的同学可以刷一遍。
[4] 斯坦福的机器学习教程,吴恩达老师是我们共同的老师。
[5] 一些培训机构的在线课程,比较适合没有大把时间学习的上班族,有人替你规划学习路线、督促你学习,目前来看价格还是不便宜的,大家自己做取舍吧。
[6] 「CSDN - Evan 的博客」,一个和你一起成长进步的热爱学习的新时代优秀青年,最大的优点是为人谦虚,低调。并没有太多才华,就是长得比较帅。关注我,让你体验超越我的感觉,重拾学习的自信与快乐。
声明
上述资源来自互联网,如有侵犯版权请联系我,我会在第一时间处理。
资料仅作为个人学习使用,切勿用在商业用途,请于下载后24小时之内删除,否则由此引发的法律纠纷及连带责任本人概不承担。
声明
上述资源来自互联网,如有侵犯版权请联系我,我会在第一时间处理。
资料仅作为个人学习使用,切勿用在商业用途,请于下载后24小时之内删除,否则由此引发的法律纠纷及连带责任本人概不承担。
欢迎关注 Evan 的博客