机器学习基础笔记(1):绪
绪
机器学习算法可以让机器基于数据进行自调整来完成相应的任务。
这些数据一般可以分为两部分:特征和标签。
特征指用于描述相关物体或事件的数据,例如描述一个人的身高,体重,血压上线,血压下线等。
标签指对目标物体的分类结果,例如在一群人中,有男 女两种性别标签。
对于数据而言,特征是必须的但是标签是可有可无的,基于带标签数据进行的机器学习算法也被称为是监督学习,基于无标签数据进行的机器学习则称为非监督学习,部分数据有标签而部分标签没有的情况叫做半监督学习。
大多数的问题都可以用监督学习的机器学习算法解决,例如各种分类问题,决策问题等。监督学习算法会基于数据构建一种数据结构来解决相应的问题,这样的数据结构也被称为模型。而用来构建模型的算法叫做学习算法。学习算法和模型是一个机器学习算法的最重要的两个部分。
机器学习算法并不是完美的,通常都会不同程度的产生误差,因此测试过程产生的预测标签可以与其数据的真实标签进行对比获得模型的准确率,用来衡量模型的性能。