机器学习Introduction

1.什么是机器学习？

　　机器学习有两种定义，一种是 Arthur Samuel 所描述的：机器学习是机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。这是一个过时、非正式的定义。Tom Mitchell 给出一种更现在的定义：

　　例子：下棋

　　　　　E=下很多盘棋的经验。

　　　　　T=下棋的任务。

　　　　　P=程序能在下一局中获胜的概率。

　　机器学习问题通常分为类：监督学习和无监督学习。

在监督学习中，我们给出一个数据集并且知道正确输出的样子，对输入和输出之间的关系明了。

监督学习问题归类成“回归”和“分类”问题。在预测问题中，我们尝试在连续的输出中预测结果，意味着我们正在试着将输入的因素映射成一些连续的函数。而在一个分类问题中，我们尝试将预测归结成一个非连续的结果。换句话说，我们试图将输入因素映射为离散的类别。

　　例子1：

给出房子真实的建筑面积，尝试去预测它的价格。价格作为面积的函数是一个连接的输出，所以这是一个回归问题。

如果把输出替换成这个房子的售价是否高于或低于要价，那么这个例子就转换成一个分类问题。

　　例子2：

（a)回归—给出一个人的照片，通过照片预测这个的年龄。

（b)分类—给出一个肿瘤患者，预测肿瘤是良性还是恶性。

　　无监督学习允许在很少或者根本不知道结果会是什么样子的情况下解决问题。我们不需要知道变量的影响就可以从数据中挖掘结构。

　　我们可以根据数据中变量之间的关系对数据进行聚类，从而得出这种结构。无监督学习没有基于预测结果的反馈。

例子：

　　聚类：对于1000000个不同的基因集合，找到一种方法，自动将这些基因分成不同的变量组，如寿命、位置、角色等。

　　非聚类：鸡尾酒会算法，要求我们在一个混乱的环境中找到结构。（即在鸡尾酒会上从一片声音中辨别出个人的声音和音乐）。

posted @ 2017-09-15 22:43 big明阅读(160) 评论(0) 编辑收藏举报

刷新页面返回顶部