统计学习方法-1

统计学习包括监督学习、非监督学习、半监督学习以及强化学习，主要学习监督学习问题。

监督学习的任务是学习一个模型，使模型能够对任意给定的输入，对其相应的输出做出一个好的预测（这里的输入、输出是指某个系统输入输出，与学习的输入输出不同），计算机的基本操作就是给定一个输入产生一个输出，所以监督学习是极其重要的统计学习分支，也是统计学习中内容最丰富、应用最广泛的部分。

1、欧氏空间：欧几里得空间就是对现实空间的规则抽象和推广（从n<=3推广到有限n维空间).

中学学的几何空间一般是2维、3维，如果将这些低维空间所总结的规律推广到有限的n维空间，那这些符合定义的空间则被统称为欧氏空间。

2、输入变量为有限个离散变量的预测问题称为回归问题；输出变量为有限个离散变量的预测问题称为分类问题；输入变量与输出变量均为变量序列的预测问题称为标注问题。

3、统计学习方法由三要素构成，可以简单地表示为：

方法=模型+策略+算法

构建一种统计学习方法就是确定具体的统计学习三要素。

1、1：
监督学习的实现步骤：
1.得到一个有限的训练数据集合

2、确定模型的假设空间，也就是所有的备选模型

3、确定模型选择的准则，即学习的策略

4、实现求解最优模型的算法

5、通过学习方法选择最优模型

6、利用学习的最优模型对新数据进行预测或分析

1、3统计学习三要素：
一、模型（假设空间）

二、策略：（以什么样的标准来确定这个模型就是最优的模型）

策略体现在损失函数上（损失函数就是对于每一个实例，我们的预测值与他真实值之间一个差别的惩罚）

策略：

1、4模型评估与模型选择

训练误差：

测试误差：

1、5 正则化与交叉验证

1、6 泛化能力

1、7生成模型与判别模型

posted @ 2021-02-04 10:36 sy- 阅读(229) 评论(0) 编辑收藏举报

刷新页面返回顶部

sy