机器学习概述

机器学习:一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P的度量,程序在处理任务T时的性能有所提升。

机器学习的两个常见问题:有监督学习和无监督学习

有监督学习:训练数据中每个输入都有对应的确定的输出(有标签)。有监督学习算法从训练集中学习到输入输出之间的联系(经验),并对新的输入能给出一个正确的输出。

有监督学习的两类问题:分类问题、回归问题

分类问题:对离散型随机变量建模或预测的监督学习算法,根据已知类别的训练集确定新数据的类别。目标:预测一个离散的输出值。

回归问题:对数值型连续随机变量建模或预测的监督学习算法,是一种估计变量之间关系的统计方法。目标:预测一个连续的输出值。

无监督学习:只给定输入数据,没有指定对应的输出(无标签),这类算法从训练集中找到数据中的一些结构、模式等。

聚类:基于数据的内部结构寻找观察样本的自然族群的无监督学习任务。

posted on 2017-07-10 16:34  J_K_Guo  阅读(108)  评论(0编辑  收藏  举报