机器学习:西瓜书笔记——绪论
引言
机器学习所研究的主要内容:是关于在计算机上从数据中产生“模型”的算法,即学习算法
。
有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型,在面对新的情况的时候,模型回归给我们提供相应的判断。
计算机科学是研究关于“算法”的学问,那么机器学习是研究“学习算法”的学问。
基本术语:
术语 | 概念 |
---|---|
数据集data set | 记录的集合,或者叫数据的集合 |
示例instance、样本sample | 每条记录是关于一个事件或者对象 |
属性attribute、特征feature | 反映事件或对象在某方面的表现或性质的事项 |
属性值attribute value | 属性上的取值 |
属性空间attribute space、样本空间 sample space | 属性长成的空间 |
特征向量 feature vector | 空间的示例 |
学习learning、训练training | 从数据中学得模型的过程 |
训练数据training data | 训练过程中使用的数据 |
训练样本training sample | 训练数据中的每一个样本 |
训练集 training set | 训练样本组成的集合 |
假设 hypothesis | 学得模型对应了关于数据的某种潜在的规律 |
真相ground—truth | 潜在规律自身 |
学习过程就是为了找出或者逼近真相。
泛化:模型有适应新样本的能力。
本文来自博客园,作者:{Zeker62},转载请注明原文链接:https://www.cnblogs.com/Zeker62/p/15046279.html