机器学习常用术语

机器学习作为人工智能的一个重要领域，我们有必要对其基本术语有清晰的理解

(1) 模型(Model)：是机器学习某个算法所导出的、能够完成训练与预测等任务的，模型常用字母表示，我们的

任务就是使用数据来训练，让能够为我们解决一系列特定的事情。而模型本身又可以衍生出两个相关的概念

$\blacklozenge$ 参数(Parameter):是决定模型的东西，我们的训练目的就是把参数训练到一个能够使模型表现最好的值。一般而言，参数会用θ来表示，从而我们的模型常可以写成如下：

表示的就是“在参数下的行为”。

$\blacklozenge$ 超参数:(Hyper Parameter),是决定模型结构或训练行为的东西。与参数不同的是超参数一般是不能被训练而只能被选择，换句话说我们可以通过选择不同的超参数来搭建出同一套算法下结构和训练方式不一样的模型，但是我们在训练的过程中，超参数常常是保持不变的。超参数可以用 $\widetilde{\theta }$ 来表示，不过需要单独指明超参数的场景很少，我们一般会将超参数和参数视为一个整体，并把这个整体用 $\Theta$ (大写的 $\theta$ )，从而模型可以表示为 $G(x)=G(x|\Theta )$ ,从直观上来看 $G(x|\Theta )$ 表示的就是“在参数和超参数的集合 $\Theta$ 下的行为”。

(2) 空间：就是表示“可能存在的取值”，比如模型空间就是表示“所有可能的模型的取值”，“参数空间”表示“所有可能的参数”，样本空间表示“所有可能的样本”。

(3)样本：是指数据集中的每一条单独的数据。如没有说明，会默认数据集中有N个样本，用符号：

，来表示数据集,其中的 $(x_{i},y_{i})$ ,就是一个样本，每个样本包含两个部分：

$\blacklozenge$ 特征向量(Feature Vector)：样本中的 $x_{i}$ 就是特征向量，我们可以将特征向量直接输入模型( $x_{i}\rightarrow G$ )，也可以先对特征向量中的各个特征(Feature)进行预处理(Preprocess),然后将预处理后的特征向量作为模型的输入( $x_{i}\rightarrow x_{i}^{*}\rightarrow G$ ),对特征向量进行预处理这一步通常称为数据预处理，此外，一般而言，我们会假设特征向量是n维的列向量，即一个特征向量中会有n个特征: