凯鲁嘎吉
用书写铭记日常,最迷人的不在远方

关于“On the eigenvectors of $p$-Laplacian”目标函数的优化问题

作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/

    图p-拉普拉斯 (Graph p-Laplacian) / p-谱聚类算法 (p-spectral clustering) 从提出到现在有一些年景了,但关于目标函数的优化问题却很少被提及,而是直接引用前人[2]的结论。这篇博客,我们追根溯源,从最初提出图p-拉普拉斯开始,来探讨目标函数的优化(最小化)问题。

1. Graph $p$-Laplacian

    给定一个带权无向图$G=(V, E)$,其中$V$是边集,$E$是点集。

    $H(V)$: The Hilbert space of real-valued functions on each vertex.

    $H(E)$: The Hilbert space of real-valued functions on each edge.

    The graph $p$-Laplacian ${{\Delta }_{p}}:H(V)\to H(V)$ 为:

${{\Delta }_{p}}f=-\frac{1}{2}div({{\left\| \nabla f \right\|}^{p-2}}\nabla f)$

    其中$\Delta $是拉普拉斯算子,$\nabla $是梯度,$div$为散度。当$p=2$时,${{\Delta }_{p}}f={{\Delta }_{2}}f=-\frac{1}{2}div(\nabla f)$,此时,图$p$-拉普拉斯退化为标准的图拉普拉斯。

    通过引入函数$f$的二次型,标准图拉普拉斯算子${{\Delta }_{2}}$满足:

$\left\langle f,{{\Delta }_{2}}f \right\rangle =\frac{1}{2}\sum\limits_{i,j\in V}{{{w}_{ij}}{{({{f}_{i}}-{{f}_{j}})}^{2}}}$

    与图拉普拉斯类似,$p$-拉普拉斯算子[1]满足:

$\left\langle f,{{\Delta }_{p}}f \right\rangle =\frac{1}{2}\sum\limits_{i,j\in V}{{{w}_{ij}}{{\left| {{f}_{i}}-{{f}_{j}} \right|}^{p}}}$

    对于每一个节点$i\in V$,未规范化的图$p$-拉普拉斯算子为:

${{(\Delta _{p}^{w})}_{i}}=\sum\limits_{j\in V}{{{w}_{ij}}{{\phi }_{p}}({{f}_{i}}-{{f}_{j}})},i\in V$

    其中${{\phi }_{p}}(x)={{\left| x \right|}^{p-1}}sig(x)$。

    定义一个特征向量

${{(\Delta _{p}^{w}f)}_{i}}={{\lambda }_{p}}{{\phi }_{p}}({{f}_{i}}),i\in V$

    注:特征向量在缩放时是不变的。

    定理1:$f$是$p$-拉普拉斯的特征向量,当且仅当下列函数${{F}_{p}}$在$f$处有临界点:

${{F}_{p}}(f)=\frac{\left\langle f,{{\Delta }_{p}}f \right\rangle }{\left\| f \right\|_{p}^{p}}=\frac{\sum\nolimits_{ij}{{{w}_{ij}}{{\left| {{f}_{i}}-{{f}_{j}} \right|}^{p}}}}{2\left\| f \right\|_{p}^{p}}$(广义Rayleigh-Ritz原理)

    其中$\left\| f \right\|_{p}^{p}=\sum\nolimits_{i}{{{\left| {{f}_{i}} \right|}^{p}}},\text{ }i,j\in V$,相应地特征值${{\lambda }_{p}}$通过等式${{\lambda }_{p}}={{F}_{p}}(f)$得出。

2. 用图$p$-拉普拉斯进行$K$聚类

    Luo等人[2]通过求解下面的$p$-拉普拉斯嵌入问题,引入了对$p$-拉普拉斯全特征向量的一种近似,目标函数为:

$\underset{F}{\mathop{\min }}\,{{J}_{E}}(F)=\sum\limits_{k}{\frac{\sum\nolimits_{ij}{{{w}_{ij}}{{\left| f_{i}^{k}-f_{j}^{k} \right|}^{p}}}}{\left\| {{f}^{k}} \right\|_{p}^{p}}}$

$s.t.\text{ }{{F}^{T}}F=I.$

    但是,在求导过程中出现错误,原文截图为:

    也就是从这里起,后面的结果已经无效。

    我推导的为:

$\frac{\partial {{J}_{E}}}{\partial f_{i}^{k}}=\frac{1}{\left\| {{f}^{k}} \right\|_{p}^{p}}\left[ p\sum\nolimits_{j}{{{w}_{ij}}{{\phi }_{p}}(f_{i}^{k}-f_{j}^{k})}-p\sum\nolimits_{j}{{{w}_{ji}}{{\phi }_{p}}(f_{j}^{k}-f_{i}^{k})} \right]-\sum\nolimits_{ij}{{{w}_{ij}}{{\left| f_{i}^{k}-f_{j}^{k} \right|}^{p}}}\cdot \frac{p\cdot {{\phi }_{p}}(f_{i}^{k})}{{{\left( \sum\nolimits_{i}{{{\left| {{f}_{i}} \right|}^{p}}} \right)}^{2}}}$

$=\frac{p}{\left\| {{f}^{k}} \right\|_{p}^{p}}\left[ 2\sum\nolimits_{j}{{{w}_{ij}}{{\phi }_{p}}(f_{i}^{k}-f_{j}^{k})}-\frac{{{\phi }_{p}}(f_{i}^{k})}{\left\| {{f}^{k}} \right\|_{p}^{p}}\sum\nolimits_{ij}{{{w}_{ij}}{{\left| f_{i}^{k}-f_{j}^{k} \right|}^{p}}} \right]$

    不管怎样,在求导的过程中,总会有系数$p$,而[2]中没有。可以认为这篇文章在求偏导的过程中出现问题。

    算法总体流程:

    注:(22)公式出错。

    有趣的是,直接引用这篇文章结论的大有论文在。例如,这一篇[4]

    更有趣的是,时隔整整十年,[3]明确指出[2]中的推导错误:

    [3]给出了他自己提的目标函数与求导公式:

    可以看出,[3]的推导结论与我的推导是一致的,只是目标函数分母部分有无系数2。

3. 参考文献

    [1] Bühler, Thomas & Hein, Matthias. (2009). Spectral clustering based on the graph Laplacian. Proceedings of the 26th International Conference On Machine Learning, ICML 2009. 382. 11-88. 10.1145/1553374.1553385.  Code: p-Spectral Clustering

    [2] Luo, Dijun & Huang, Heng & Ding, Chris & Nie, Feiping. (2010). On the eigenvectors of p-Laplacian. Machine Learning. 81. 37-51. 10.1007/s10994-010-5201-z.

    [3] Pasadakis, Dimosthenis & Alappat, Christie & Schenk, Olaf & Wellein, Gerhard. (2020). $K$-way $p$-spectral clustering on Grassmann manifolds.

    [4] W. Liu, X. Ma, Y. Zhou, D. Tao and J. Cheng, "$p$-Laplacian Regularization for Scene Recognition," in IEEE Transactions on Cybernetics, vol. 49, no. 8, pp. 2927-2940, Aug. 2019, doi: 10.1109/TCYB.2018.2833843.

    [5] 拉普拉斯矩阵与拉普拉斯算子的关系 - 知乎 

最后的思考:做研究切忌浮躁,要追根溯源,明白公式的来龙去脉,自己动手,丰衣足食。

posted on 2020-11-06 16:05  凯鲁嘎吉  阅读(533)  评论(0编辑  收藏  举报