序言

过去二十年,计算机科学领域正在发生着一场静默的革命。如今,我们越来越发现计算机程序—可以自动改变自己的行为以更好的适应任务需求。现在,有的程序已经可以进行人脸识别,进行语言翻译、自动驾驶,推荐好看的电影—将来程序能做的事情会更多。

 

过去,通常都是程序员使用编程语言实现算法,来定义程序的功能。但是现在,对于某些任务来说,我们无需写程序,只需收集数据。这些数据包括需要完成的实例和学习算法,该学习算法会自动修改学习者程序,以匹配需求中指定的数据。

 

自从计算机于上世纪中期出现后,我们的生活变得越来越计算机化和数字化。计算机已经不再是曾经的计算器。数据库和数字化媒体已取代打印机成为信息存储的主要媒介。通过计算机网络进行的数字化交流也已经取代了信件,成为了信息交流的主要模式。个人电脑拥有图形化操作界面,可以连接手机和其他智能设备,这使得计算机变成了广泛使用的家用设备,就像电视机和微波炉一样。如今得益于在线网络---各种信息,不只是数字和文本,还包括图像,视频,音频等等都可以以数字化的方式进行存储,处理和传输。这种信息的数字化,会产生大量的数据,这种数据潮—我们称为数据地震—触发了人们对于数据分析和机器学习的广泛的兴趣。

 

对于许多应用来说,从憧憬到演讲,从翻译到机器人学—我们无法设计出非常好的算法,尽管相关的研究从20世纪50年代就开始了。但是,我们却可以很容易的从这些应用中搜集数据,所以现在的办法是让程序自动从数据中学习,从而用学习程序替代程序员。这正是机器学习的用武之地。使用机器学习,并不仅仅因为近二十年来,数据持续增长,数据量更大,还因为将数据处理成知识的机器学习理论取得了显著的进步。

 

今天,在零售业、金融业和制造业等不同类型的行业中,越来越多的数据持续产生并收集了起来。在不同的科学领域如天文学、生物科学中亦是如此。在我们的日常生活中也是这样,数字技术日益渗透到我们的日常生活中,深化了我们的数字脚印, 我们不仅是消费者和用户,还是社交媒体用户—我们把越来越多的日常生活发布在社交媒体上,这些记录也变成了数据。无论数据来自商业、科学还是个人,如果不去利用,它们就毫无用处。聪明的人找到了使用这些数据的新方法,把它们变成了有用的产品和服务。机器学习在这个过程中发挥了越发重要的作用。

 

我们相信,在这些看似复杂的庞大数据量背后,一定存在着简单的解释方法。也就是说,尽管数据量很大,一定可以以一种相对简单的模式来解释,这种模式包含少量的隐含因素以及隐含因素之间的交互。想想数百万的消费者,他们每天在网上或当地的超市购买成千上万的商品。这意味着交易数据库非常庞大,但是还好这些数据符合某种模式。人们并不是随机购物的。举办派对的消费者,会购买某一特定集合的商品。家里有孩子的消费者,会购买另一集合的商品—这就是解释客户行为的隐含因素。由此可以推断出一个隐形模型-也就是指,通过观察到的数据得到了这些潜在的因素和它们之间的相互作用—这些数据就是机器学习的核心。

 

机器学习不只是用应用于商业、用来从信息中提取数据的方法。机器学习还是智能系统的前提。智能系统要能够适应其所在环境,重复成功而非失败经验。之前,研究人员一直认为,要想实现人工智能系统,我们需要新的范例、新的思考方式、新的计算模型、一整套新的算法。考虑到最近几期学习在各个领域取得的成功范例,现在我们可以说,要想实现人工智能系统,我们需要的不是一套新的科学算法,而是更多的例数据,需要充足的计算能力,可以在海量数据上运行学习算法,从中得到必须的算法。

 

我们由此可能推测出,像机器翻译及计划这样的任务,可以使用这样的学习算法--相对简单,却又需要使用大量的例数据训练。最近,深度学习的成功证明了这一推测。

看起来人工智能也并非源自什么稀奇古怪的配方,而是源于耐心、完全使用简单直观的算法。

 

随着技术的发展,我们的计算机运行得更快,数据更多,机器学习算法将产生稍高级别的智能,用于一套新的稍稍智能的设备和软件中。在本世纪结束前,若是这种习得智能某天能达到人类的智力水平,也并不令人惊讶。

 

我编写这本书的时候,最享有盛名的科学杂志之一《科学》(Science)在其2015年7月15日发行本中刊登了一个关于人工智能的专题。尽管题目是人工智能,但是突出的主题却是机器学习。这只是又一个迹象,表明了机器学习现在是人工智能领域的驱动力。上世纪80年代人们对基于逻辑、编程专家系统失望后,机器学习复兴了该领域并取得了显著的成果。

本书的目的是让读者对什么是机器学习,对一些重要的学习算法的基本原理,以及一组应用范例有总体的认识与了解。本书针对的是普通读者群,只讨论了机器学习方法的本质而没有涉及任何数学和编程细节。书中也没有涉及机器学习应用方面的详细内容,讨论了一些例子,只是为了给出基本原理而不是详细讲解某一个例子。

 

要想了解更多关于机器学习算法的信息,读者可以参考书中重点参考的书:Ethem Alpaydin,机器学习介绍,第三版(剑桥,MA:麻省理工学院出版社,2014)

注:本书属作者免费翻译,如有版权问题,请与我联系删除。

posted on 2018-09-20 14:10  SuperJulia  阅读(125)  评论(0编辑  收藏  举报