论文笔记：Meta-Graph Based Recommendation Fusion over Heterogeneous Information Networks （KDD 2017）

研究动机

异构信息网络是推荐系统中重要的数据表示。异构信息网络的推荐系统常常面临2个问题：如何去表示推荐系统的高级语义，如何向推荐系统中融入异构信息。在这篇文章中，我们首先将meta-graph融入到HIN-based推荐系统中，然后利用”MF+FM“的方法求解信息融合问题。对于每个meta-graph生成的相似性，利用MF的方法进行生成用户的潜在特征和项目的潜在特征。针对不同的mate-graph特征，我们提出了一种基于群lasso正则化的FM方法，去自动从观察到的信息中有效的选择有效的meta-graph方法。

传统的模型

为了结合丰富的语义，HIN首先构建异构网络的网络模式。比如，在Yelp中，网络模式是在实体类型上定义的 User，Review，Word，Business，然后，受实体类型约束的语义关联可以通过元路径上两个实体之间的相似性来定义。对于传统的协同过滤推荐，如果我们想把business推荐给用户，我们可以建立一个简单的meta-path Business->User然后从这个元路径中进行学习。同时，在异构网络中，我们也可以定义更复杂的meta-path，比如 User->Review -> Word -> Review -> Business, 这个meta-path定义了如果用户与其他用户对相同的Business进行了相似的评论，以度量用户是否倾向于喜欢某个业务。

存在的挑战

元路径可能不是描述丰富语义的最佳方法，所以可以采用meta-graph，相比 meta-path 要求必须是 sequence 的结构，meta-graph 只要求「一个起点和一个终点，中间结构并不限制」
不同的meta-path和不同的meta-graph会导致不同的相似性，如果有效的结合它们，是另一个挑战。考虑到我们最终的目标是生成一个user-item评分矩阵，所以可以将其考虑为一个矩阵补全问题，所以，解决的方法有两种：
- 第一种：使用meta-path生成大量的备选相似度，然后学习不同元路径的加权机制，将相似性显式地结合起来，逼近观察到的用户-项目评价矩阵，这种方法没有考虑jmeta-path的隐式因素，每个可选的相似矩阵可能非常稀疏，从而有助于最终的集成。
- 第二种：对每个元路径计算的用户项相似矩阵进行因子分解，然后利用潜在特征恢复一个新的用户项矩阵。然而这种方法不太好，因为每个meta-path不能看到其他的变量，只能看到其他变量预测出来的单个值。

面对以上的挑战，作者想到了一个新的结合方法，来充分的结合不同的潜在特征。

不使用meta-path，而是使用meta-graph，将更复杂的语义信息融入到我们的预测问题之中
没有直接的去计算recovered矩阵，而是使用了所有meta-graphs的潜在特征。对于每一个meta-graph，我们首先计算user-item的相似度矩阵，然后利用MF方法，分解成user 和 itemde 潜在向量。然后从不同的meta-graph获取到不同的user 和 item 向量，并利用FM把它们组装起来。

通过这种方式，我们可以自动确定应该使用哪个元图来解决新出现的问题，以及对于生成的每个元图用户和项向量，应该如何对它们进行加权。

模型框架

基于meta-graph的相似度

Meta-graph的定义如下

作者写出了所有的meta-graph，我们可以看到所有的U(User)为源节点，B(Business)为目标节点。

根据以上的定义，我们需要计算源节点和目标节点的相似性。

commuting matrices [32] have been used to compute the counting based similarity matrix of a meta-path。

可交换矩阵维基百科定义

假设我们有一个meta-path，

这时我们可以定义一个矩阵$W_{A_iA_j}$作为$A_i$和$A_j$的邻接矩阵。然后路径$P$的可交换矩阵（the commuting matrix）为

如何去计算meta-graph的可交换矩阵

利用meta-graph计算完所有的users和item的相似度之后，我们就可以获得一个相似度矩阵，其中表示user $u_i$和item $b_j$在meta-graph下的相似度，其中$m$和$n$是users和items的数量。如果设计了L个meta－graph，那么就是L个个不同的user-item相似度矩阵，它们的表示为