机器学习(一)
对学习的定义
学习经验E 完成任务T 绩效指标P
对于某类任务T和性能度量P,如果一个计算机程序在完成T上以P来衡量完成的好坏,并随着经验E而自我完善,那么我们称这个计算机程序在从经验E中学习
(常用)机器学习算法,主要是以下两种:
监督学习
非监督学习
(其他)学习算法等
加强学习
推荐系统
(概念)监督学习:
我们根据已有的数据集,已经知道正确输出是怎么样的,即输出和输入存在映射关系。
无监督学习
结果很少或者不知道结果好坏,但可以基于数据对数据进行聚类导出数据得分类结构,从中获得信息。
分为回归和分类问题:
回归:
在连续输出中预测结果,也就是根据输入变量映射到某些连续函数
分类:
尝试将输入变量映射为离散类别
(支持向量机算法:让电脑处理无限多的特征)
学习算法
1.(主)线性回归算法
在监督学习中数据集被称为训练集
m表示训练样本数
x表示输入变量值
y表示输出样本值
把训练集中的数据喂给学习算法
得到一个函数h
x→h→y
机器学习流程基本架构
对于一些机器学习算法的介绍,会在后续的博客中提到