再生核希尔伯特空间(RKHS)在监督学习(SVM)中的应用
【转载请注明出处】http://www.cnblogs.com/mashiqi
2014/4/10
在网上找到一个讲reproducing kernel的tutorial看了一看,下面介绍一下。
首先定义kernel(核):
于是我们可以从一个空间定义出一个kernel。接着,我们使用一个kernel来定义一个从到的映射,并称这个映射为reproducing kernel feature map(再生核特征映射):
.
这个映射的意思是:特定的kernel和上的一个特定的元素构成了一个映射规则,将的任意元素的映射成一个实数,那么,实际上,就是将映射成了。
值得注意的是,在泛函分析中,Hilbert空间上的"表现定理"说的是,任意一个内积都可以等价于一个线性泛函,任意一个线性泛函也等价于某个内积,即对任意线性泛函,,使得。然而这里的"再生核特征映射"和"线性泛函"的区别是:
再生核特征映射是由某个核生成的;
而线性泛函是由内积生成的。
下面我们通过这个映射来定义一个Hilbert space。
第一步,构造一个空间(现在它还不完备,稍后会将它完备化)。于是,将所张成的空间记为:
第二步,在上定义内积:
于是我们可以很容易的验证此内积满足内积的三个条件。
第三步,将空间完备化。
于是我们就由kernel构造出一个完备的希尔伯特空间,此空间称为reproducing kernel Hilbert space(再生核希尔伯特空间):
在第二步定义内积的过程中,我们可以发现,对于,有
我们称满足的为reproducing kernel(再生核)。
Reference
[1] http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf
2014/4/19
今天接着10号继续看再生核空间的内容。
今天终于有了些进展,下面讲讲这个再生核到底是怎么回事。
首先我们有一个由泛函构成的空间:
这些泛函又是定义在集合上的。通常,我们的思路一般会把默认为Hilbert空间,然后将理解为它的对偶空间。我最开始就是这样默认的。但是其实这里不应该这样去理解它。再生核理论基本上了默认以空间为Hilbert空间的,而集合只是理解为一个一般的集合。然后,再生核也是内的一个元,只是他相比较于一般的元而言,拥有更多的性质。好,大概铺垫完了,下面给出一些具体的定义,大部分内容来自。
我们首先来给出reproducing Kernel(r.k.再生核)的定义:
也就是说,现在我们有一个Hilbert空间,Hilbert空间里面的每一个点都是一个泛函:
而也是一个泛函:
并且还必须满足两条性质:
1、对于一个固定的,是Hilbert空间中的一个元素;
2、再生性质:对于每个和,都有:
其中表示Hilbert空间上的内积运算。根据这个再生性质,我们立即可以得到:
值得注意的是,式是一个令人满意的结果,根据这个式子我们可以很容易的得到的正定性。根据这个再生性质,我们立即可以得到以下几个推论(直接截图了):
如果存在则唯一(表示reproducing kernel):
"存在再生核"等价于"每个泛函都连续":
(*注:这里的连续性是指的上的泛函关于连续,而不是指的关于连续)
证明:
记上的泛函为,当上存在kernel时,有:
而根据式我们有:
所以:
其中和无关。所以是有界泛函。又因为显然是线性的,所以是连续泛函。
而当是连续泛函时,因为它是线性的,所以根据表现定理即可证明。
证毕。
这也正如中所说:
再生核的正定性:
正定性证明:
证毕。
(*注:正定性是指在集合上的正定性,)
还有一些其他性质,除了"命题8"以外,其他命题对于本次学习的目标并不是很重要:
接着我们要做的事就是构造这样一个Hilbert空间,这个空间上的内积,以及这个空间上的唯一的一个kernel。
Reference
[1] Aronszajn, Nachman. "Theory of reproducing kernels." Transactions of the American mathematical society (1950): 337-404.
[2] 王敏慧,"几类高斯过程的Karhunen-Loève展开及再生核希尔伯特空间"[D],哈尔滨工业大学,2010
[3]Aronsazjn, Par N. "La théorie des noyaux reproduisants et ses applications Première Partie." Mathematical Proceedings of Cambridge Philosophical Society.Vol. 39. No. 03. Cambridge University Press, 1943.
[4] http://www.cs.berkeley.edu/~bartlett/courses/281b-sp08/7.pdf
2014/4/20
今天希望了解到上面所讲的关于RKHS的性质与我们SVM中(以及其他机器学习技术)的核技术的联系。
我们接着看的5.1.3的定理1:
上面的逻辑可以这样描绘(这个图是重点):
上图分别存在三个集合,分别表示集合,RKHS,和我们所需要的空间。分别存在三个映射①②③,分别表示到的映射,到的映射,和到之间的映射,当的维数至多可数时,就是空间。首先讲解映射①,因为存在关系式:
所以存在映射,使得:
。又因为与都是Hilbert空间,所以同构,所以存在同构映射,使得:
那么,有了这两步的铺垫(映射①与映射②),我们便可以借助和搭建到之间的映射。结合两式,我们得到:
记新的复合映射为:
便得到了:
我们应该注意的是,虽然最后的式并没有涉及到Hilbert空间,但是如果没有空间在其中牵线搭桥,引出两个映射和,那我们也不可能找到映射使得式得意满足。数学中的许多抽象概念在一些工程应用中虽不直接体现,但却给这些工程应用搭建了一些桥梁,使得工作可以继续深入!
Reference
[1] Aronszajn, Nachman. "Theory of reproducing kernels." Transactions of the American mathematical society (1950): 337-404.
[2] 王敏慧,"几类高斯过程的Karhunen-Loève展开及再生核希尔伯特空间"[D],哈尔滨工业大学,2010