机器学习基石1-概述

注:
文章中所有的图片均来自台湾大学林轩田《机器学习基石》课程。
笔记原作者:红色石头
微信公众号:AI有道

一、What is Machine Learning

什么是“学习”?学习就是人类通过观察、积累经验,掌握某项技能或能力。就好像我们从小学习识别字母、认识汉字,就是学习的过程。而机器学习(Machine Learning),顾名思义,就是让机器(计算机)也能向人类一样,通过观察大量的数据和训练,发现事物规律,获得某种分析问题、解决问题的能力。

机器学习可以被定义为:Improving some performance measure with experience computed from data. 也就是机器从数据中总结经验,从数据中找出某种规律或者模型,并用它来解决实际问题。

什么情况下会使用机器学习来解决问题呢?其实,目前机器学习的应用非常广泛,基本上任何场合都能够看到它的身影。其应用场合大致可归纳为三个条件:

  • 事物本身存在某种潜在规律
  • 某些问题难以使用普通编程解决
  • 有大量的数据样本可供使用

二、Applications of Machine Learning


  1. Abu-Mostafa, 2012

  2. Sadilek et al., 2013

  3. Tsanas and Xifara, 2012

  4. Stalkamo et al., 2012

机器学习在我们的衣、食、住、行、教育、娱乐等各个方面都有着广泛的应用,我们的生活处处都离不开机器学习。比如,打开购物网站,网站就会给我们自动推荐我们可能会喜欢的商品;电影频道会根据用户的浏览记录和观影记录,向不同用户推荐他们可能喜欢的电影等等,到处都有机器学习的影子。

三、Components of Machine Learning

  • 输入\(x\)
  • 输出\(y\)
  • 目标函数\(f\),即最接近实际样本分布的规律
  • 训练样本data
  • 假设hypothesis,一个机器学习模型对应了很多不同的hypothesis,通过演算法A,选择一个最佳的hypothesis对应的函数称为\(g\)\(g\)能最好地表示事物的内在规律,也是我们最终想要得到的模型表达式。

实际中,机器学习的流程图可以表示为:

对于理想的目标函数\(f\),我们是不知道的,我们手上拿到的是一些训练样本\(D\),假设是监督式学习,其中有输入\(x\),也有输出\(y\)。机器学习的过程,就是根据先验知识选择模型,该模型对应的hypothesis set(用\(\mathcal{H}\)表示),\(\mathcal{H}\)中包含了许多不同的hypothesis,通过演算法A,在训练样本\(D\)上进行训练,选择出一个最好的hypothes,对应的函数表达式\(g\)就是我们最终要求的。一般情况下,\(g\)能最接近目标函数\(f\),这样,机器学习的整个流程就完成了。

四、Machine Learning and Other Fields

  1. Data Mining: while data mining and machine learning do share a huge overlap, they are arguably not equivalent because of difference of focus.

  2. AI: machine learning is a route to realize artificial intelligence.

  3. Statistics: statistics can be used for data mining.

posted @ 2019-03-14 10:39  Shinesu  阅读(230)  评论(0编辑  收藏  举报