机器学习的定义与分类

机器学习的定义

Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed
译：机器学习是通过非显著式编程使得计算机获得学习能力的领域

显著式编程

例如对于区分菊花与玫瑰，如果认为告诉计算机，菊花为黄色，玫瑰为红色，则计算机看到黄色则识别为菊花，看到红色则识别为玫瑰，此为显著式编程。
若仅仅给计算机输入一堆菊花与一堆玫瑰的图片，然后编写程序，让计算机自己区别菊花与玫瑰的区别，计算机也能通过大量的图片，总结出菊花是黄色的，玫瑰是红色的规律，也能总结出菊花花瓣较长，玫瑰花瓣较圆等等可以区分两种花的规律。即让计算机自己总结规律的编程方法，叫做非显著式编程

A computer program is said to learn from experience E with respect to some tast T and some performance measure P if its performance on T as measured by P improved with experience E.
译：一个计算机程序被称为可以学习，是指它能够针对某个任务T和某个性能指标P，从经验E中学习。这种学习的特点是，它在T上的被P所衡量的性能，会随着经验E的增加而提高。

机器学习任务的分类

监督学习：所有经验E都是人工采集并输入计算机的机器学习任务，称为监督学习。

强化学习：经验E是由计算机与环境互动获得的，计算机产生行为，同时获得这个行为的结果，程序只需要定义行为的收益函数，设计算法，让计算机改变自己的行为模式去最大化收益函数。此类让计算机通过与环境的互动逐渐强化自己的行为模式，称为强化学习。

监督学习分类

根据数据标签存在与否的分类
1. 传统的监督学习
  每一个训练数据都有对应的标签，代表算法有：支持向量机、人工神经网络、深度神经网络。
2. 非监督学习
  如果所有的训练数据都没有对应的标签，则称为非监督学习。
  需要假设：同一类的新联数据在空间中距离更近，则可根据样本空间的信息，设计算法将其聚集为两类，从而实现无监督学习。
  代表算法：聚类、EM算法、主成分分析
3. 半监督学习
  训练数据中一部分有标签，一部分没有标签，研究利用少量的标注数据和大量的未标注数据来设计算法进行学习。
基于标签的固有属性分类
1. 分类
  监督学习中，标签是离散的值，则为分类任务。
2. 回归
  监督学习中，标签是连续的值，则为回归任务。

发表于 2022-07-14 17:40 ~ZWJ2001 阅读(513) 评论(0) 收藏举报

刷新页面返回顶部