关于Noise and Error主题的一些小知识

(一)Noise会不会对VC bound产生影响?

此笔记源于台湾大学林轩田老师《机器学习基石》《机器学习技法

 

答案是不会。

当信号中加入了Noise,其实对我们之前学过的内容不产生任何本质上的影响。

之前《机器学习真的起作用吗?》中的分析是基于:training dataset D的来源是:(x,f(x))。其中x从服从某一概率分布P。

现在noise对数据产生了什么影响?之前,f(x)是确定的。现在f(x)不确定了。因为Noise的存在会影响f(x)的值。此时y更像是服从某一概率分布。但是抽样的一瞬间,y是确定的值。我们要估计的就是抽样这一瞬间,整体中的x和y。

image

如上,根本不影响我们的理论分析。

 

                                                        (二)err与err’

根据之前我们的学习,我们知道,Learning Algorithm A的一个重要的原则是:使得Ein很小(即选择的g在inside D上犯的错误很小)。

g在D上犯得错误记作err。

同时我们知道,错误的评估函数也是A的重要组成部分,记作err’。

理论上来说:err’=err.

但是在实际中很难实现,我们甚至无法准确地描述err是什么样子的。又或者err非常不利于计算。

通常情况下,我们使用不同于err的err’作为A的key part。

image

image

上面这个流程图是一个机器学习的基本流程:其中我们使用err’进行学习,使用真正的err进行评估。

posted @ 2016-04-27 15:19  wangyanphp  阅读(191)  评论(0编辑  收藏  举报