令狐葱

大漠孤烟直,长河落日圆。

博客园 首页 订阅 管理

1 什么是机器学习

角度1:机器学习领域专家Tom Mitchell认为,机器学习所关注的问题是:“计算机程序如何随着经验积累自动提高性能”。在形式上是“对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么称这个计算机程序在从经验E学习。

评论:Tom Mitchell强调计算机程序可以通过对数据的分析累积经验实现自我性能的提升。

角度2:三个斯坦福大学的统计学家认为机器学习让许多领域产生的大量数据变得有意义,其形式上是从数据提取出模式和趋势,理解”数据在说什么“,我们称之为从数据中学习。

评论:统计学家强调发现和理解大量数据形成的统计规律性。

角度3:国内李航老师在其《统计学习方法》一书认为:统计机器学习是关于计算机基于数据构建概率模型并运用模型对数据预测与分析的一门学科。

评论:李航老师的强调机器学习的要素(数据、模型、计算预测)内在联系。

个人理解:套用Herbert A.Simon的关于学习的定义:”如果一个系统能够通过执行某个过程改进它的性能,就是学习”。
我理解的机器学习是:

“计算机利用基于所收集事物的属性或行为数据的统计规律性总结出的特定模式去预测或判定事物的属性或行为的过程中,持续改进预测或判断的准确性。“

机器学习饿预测与物理上基于微积分方程(解析式)的准确预测的最大不同在于我们事先无法获得事物发展的准确模型,只能以数据驱动构建基本的模型框架去分析新数据。如果把微积分模型看做一个箱子,那么这是一个透明的箱子,但是机器学习的模型却是一个黑箱子。黑箱子理装的可能是各种模型中一种。也就是说同样的数据,你得到不同类型的模型。程序员的任务就是基于数据寻找最合适的模型。

从这个理解出发,对于一个问题是否可以应用机器学习的必要条件是:

• 系统中存在某种模式

• 这种模式不可以用一般的解析手段描述

• 数据必须可以获取且具有一定规模。

posted on 2017-11-12 11:49  livermorium116  阅读(158)  评论(0编辑  收藏  举报