ML机器学习_名词解释

名词解释

监督学习:supervised learning:

 

监督学习:贝叶斯,决策树,神经网络,SVM

非监督学习:unupervised learning:

 

非监督学习:分级聚类/K mean 聚类;

 

置信风险/期望风险: 分类器对 未知样本进行分类,得到的误差。也叫期望风险。

松弛变量:解决近似可分的问题。

经验风险: 训练好的分类器,对训练样本重新分类得到的误差。即样本误差

结构风险:[置信风险, 经验风险], 如(置信风险 + 经验风险) / 2

经验风险最小化

有序风险最小化

 

标称型:有限目标集中取值,如真假  ,主要用于分类

 

精度

Accuracy

 

错误率

Error rate

 

误差

Error

 

 

精度

Accuracy

 

错误率

Error rate

 

误差

Error

 

训练误差、经验误差

Training error, empirical error

 

 

测试误差

Testing error

 

 

假设检验:

正态分布:

T检验

 

机器学习

Machine learning

 

数据集

Data set

 

示例、样本

Instance,sample

 

属性、特征

Attribute , feature

 

维数

Dimension

 

学习器

Learner

 

分类

Classification

Multi-classification

Binary classification

 

 

回归

Regression

 

 

VC维:研究学习过程一致收敛的速度和推广性;VC维反映了函数集的学习能力,VC维越大则学习机器越复杂(容量越大)

泛化能力:Generalization ,模型适用于新样本的能力

 

 

分布

Distribution

 

 

归纳

Induction

演绎

Deduction

 

过拟合:建模过于具体化,特别特征过多的纳入模型

Over fitting

 

欠拟合:缺少通性

Under fitting

 

聚类

Clustering

Cluster

posted @ 2018-01-08 15:03  木石1987  阅读(283)  评论(0编辑  收藏  举报