A Tale of Two Graphs: Freezing and Denoising Graph Structures for Multimodal Recommendation

Zhou X. and Shen Z. A tale of two graphs: Freezing and denoising graph structures for multimodal recommendation.

概

本文主要是对 LATTICE 的改进.

其它部分, FREEDOM 和 LATTICE 差别不大, 另一个比较明显差别是对于 User-Item graph 的处理, 简而言之, FREEDOM 的 user-item 图是"动态"采样的.
假设 User-Item 的交互图为 \(\mathcal{G} = (\mathcal{V}, \mathcal{E})\), 每条边的权重的采样概率为

\[p_{e_{ij}} = \frac{1}{ \sqrt{\omega_i} \sqrt{\omega_j} }, \quad e_{ij} \in \mathcal{E}. \]
其中 \(\omega_i\) 表示节点 \(i\) 的度数. 故而, 一条边若是连接了高度数的节点, 则它有比较小的概率被采样到.
我们用 \(\hat{A}_{\rho}\) 来表示采样后且标准化后的图.

接下来, 用上面得到的两个图进行特征的提取.
对于模态的图, 我们用于处理 item 的 embedding:

\[\tilde{\bm{h}}_i^l = \sum_{j \in \mathcal{N}(i)} S_{ij} \tilde{\bm{h}}_j^{l-1}, \quad \bm{h}_i^0 = \bm{x}_i. \]
接着, 对于 user-item graph, 作者利用 LightGCN 得到

\[\hat{\bm{h}}_u, \hat{\bm{h}}_i. \]
最后我们将两部分的 embeddiing 融合在一起得到:

\[\bm{h}_u = \hat{\bm{h}}_u, \\ \bm{h}_i = \tilde{\bm{h}}_i + \hat{\bm{h}}_i. \]
除此之外, 还有 modality-specific 的特征

\[\bm{h}_i^m = \bm{x}^m W_m + \bm{b}_m. \]
最后通过如下的损失进行训练:

\[\mathcal{L}_{bpr} = \sum_{(u, i, j) \in \mathcal{D}} \bigg( -\log \sigma(\bm{h}_u^T \bm{h}_i - \bm{h}_u^T \bm{h}_j) + \lambda \sum_{m \in \mathcal{M}} -\log \sigma ( \bm{h}_u^T \bm{h}_i^m - \bm{h}_u^T \bm{h}_j^m ) \bigg). \]

posted @ 2024-03-21 16:32 馒头and花卷阅读(103) 评论(0) 编辑收藏举报

刷新页面返回顶部