机器学习概述

机器学习：一个程序被认为能从经验E中学习，解决任务T，达到性能度量值P，当且仅当，有了经验E后，经过P的度量，程序在处理任务T时的性能有所提升。

机器学习的两个常见问题：有监督学习和无监督学习

有监督学习：训练数据中每个输入都有对应的确定的输出（有标签）。有监督学习算法从训练集中学习到输入输出之间的联系（经验），并对新的输入能给出一个正确的输出。

有监督学习的两类问题：分类问题、回归问题

分类问题：对离散型随机变量建模或预测的监督学习算法，根据已知类别的训练集确定新数据的类别。目标：预测一个离散的输出值。

回归问题：对数值型连续随机变量建模或预测的监督学习算法，是一种估计变量之间关系的统计方法。目标：预测一个连续的输出值。

无监督学习：只给定输入数据，没有指定对应的输出（无标签），这类算法从训练集中找到数据中的一些结构、模式等。

聚类：基于数据的内部结构寻找观察样本的自然族群的无监督学习任务。

posted on 2017-07-10 16:34 J_K_Guo 阅读(108) 评论(0) 编辑收藏举报

刷新页面返回顶部

J_K_Guo