机器学习的定义

Machine Learning is Fields of study that gives computers the ability to learn without being explicitly programmed
译:机器学习是通过非显著式编程使得计算机获得学习能力的领域

显著式编程

  • 例如对于区分菊花与玫瑰,如果认为告诉计算机,菊花为黄色,玫瑰为红色,则计算机看到黄色则识别为菊花,看到红色则识别为玫瑰,此为显著式编程
  • 若仅仅给计算机输入一堆菊花与一堆玫瑰的图片,然后编写程序,让计算机自己区别菊花与玫瑰的区别,计算机也能通过大量的图片,总结出菊花是黄色的,玫瑰是红色的规律,也能总结出菊花花瓣较长,玫瑰花瓣较圆等等可以区分两种花的规律。即让计算机自己总结规律的编程方法,叫做非显著式编程

A computer program is said to learn from experience E with respect to some tast T and some performance measure P if its performance on T as measured by P improved with experience E.
译:一个计算机程序被称为可以学习,是指它能够针对某个任务T和某个性能指标P,从经验E中学习。这种学习的特点是,它在T上的被P所衡量的性能,会随着经验E的增加而提高。

机器学习任务的分类

监督学习:所有经验E都是人工采集并输入计算机的机器学习任务,称为监督学习。

强化学习:经验E是由计算机与环境互动获得的,计算机产生行为,同时获得这个行为的结果,程序只需要定义行为的收益函数,设计算法,让计算机改变自己的行为模式去最大化收益函数。此类让计算机通过与环境的互动逐渐强化自己的行为模式,称为强化学习。

监督学习分类

  • 根据数据标签存在与否的分类

    1. 传统的监督学习
      每一个训练数据都有对应的标签,代表算法有:支持向量机人工神经网络深度神经网络
    2. 非监督学习
      如果所有的训练数据都没有对应的标签,则称为非监督学习。
      需要假设:同一类的新联数据在空间中距离更近,则可根据样本空间的信息,设计算法将其聚集为两类,从而实现无监督学习。
      代表算法:聚类EM算法主成分分析
    3. 半监督学习
      训练数据中一部分有标签,一部分没有标签,研究利用少量的标注数据和大量的未标注数据来设计算法进行学习。
  • 基于标签的固有属性分类

    1. 分类
      监督学习中,标签是离散的值,则为分类任务。

    2. 回归
      监督学习中,标签是连续的值,则为回归任务。