(译)序列推荐系统:挑战,进程与发展
摘要
在近几年,序列推荐系统(SRSs)的新兴主题已经吸引了越来越多的注意。传统的推荐系统使用协同过滤和基于内容的过滤,与之不同的是,序列推荐系统试图去理解和构建一个序列模型,这个序列中包括了使用者行为习惯,用户与商品的交互,用户偏好的发展,商品流行的时间。序列推荐系统包含了以上几个方面,以便更加精确地描述用户的信息、意图和目标以及商品的消费趋势等特征,从而进行更加准确、个性化和动态地推荐。在本文中,我们对序列推荐系统进行了一次系统的回顾。首先我们展示了序列推荐系统的特点,接着总结并归纳这个研究领域的关键挑战,然后是这个主题的相应研究进程,这其中包括大量近期相关的典型发展情况。最后,我们讨论了在这个充满活力的领域里,我们这个研究方向的重要性。
1.简介
序列推荐系统推荐那些多半对用户来说是有趣的商品,其方法是在一个序列中通过建立用户-商品交互(例如:在一个网络平台上浏览或购买商品)的依赖关系的模型。传统推荐系统中,包含基于内容的推荐系统和协同过滤式的推荐系统,以静态方法构造用户-商品间的交互并且使其只能捕获用户的一般性偏好。相反,顺序推荐系统将用户-商品的交互当做一种动态的序列并且将这个序列的依赖关系变成用于捕获当前和最近的用户偏好以便更加精确地推荐[Chen et al.,2018]。为了强化对序列推荐系统的理解,接下来我们展示序列推荐系统的动机与形式化。
动机:为什么是序列推荐系统?
用户-商品的交互本质上是顺序依赖的。在现实世界中,用户的购物行为通常发生在一个序列中,而不是以一种孤立的方式发生。将Jimmy的购物事件作为例子展示在图1中Jimmy放假之前,他定好了飞机、宾馆并且成功租了一辆车,他的下一步行动多半是自驾去一个有吸引力的景点进行参观。在这个样例中,宾馆多半距离航班目的地的机场比较近,而租车的地点应该与这个宾馆也不远。在这个方案中,Jimmy的每次下一步的行为均取决于先前的那些行为,因此这四步消费行为都是顺序依赖。同样的,在Tina的样例中我们也能看到这种顺序依赖。这种顺序依赖通常存在于交易数据中,但是不能被传统基于内容的推荐系统或协同过滤式的推荐系统很好地捕获[Kang et al.2018],那实质上成为序列推荐系统的发展动机。
图1 两个序列推荐系统的例子:(1)Jimmy定了一张机票、一个旅馆并租了一辆车,他下一步的行动会是什么?(2)Tina买了一个手机、一个手表和一副耳机后,她接下来会买什么?
用户的喜好和商品的流行度随着时间的推移是动态的而非静态的。事实上,一个用户的喜好和品位可能会随着时间的推移而改变。例如,很多过去是iPhone手机粉丝的年轻人,现在已经选择成为华为、三星等手机制造商的粉丝,近几年来iPhone的流行度已经下降了。这种动态对于精确定位一个用户或为了更加准确地推荐商品来说有十分重大的意义,并且它们只能通过序列推荐系统被捕获。
用户-商品交互通常发生于特定的顺序上下文中。不同的上下文通常导致不同的用户与商品间的交互,然而,这经常被像协同过滤这样的传统推荐系统所忽视。相反,一个顺序推荐系统将先前的顺序交互作为上下文用来预测哪些商品在不久的未来将被交互。因此,通过防止推荐一些与已经选择过相同或相似的商品,是推荐结果多样化是简单的。
形式化:顺序推荐系统是什么?
通常来说,一个顺序推荐系统将用户-商品的交互顺序作为输入,并在不久后的未来通过在用户-商品间的交互顺序中嵌入一个顺序的依赖关系来预测以后用户与商品间的交互。更特殊的是,给定一个用户-商品间的交互顺序,那么一个推荐列表中排在顶端的候选商品是通过效用函数最大化(例如:似然函数)生成的。
R = arg max f(S) (1)
公式中的f是效用函数中用于输出对候选商品排序的分数,它可能有多种形式,像条件概率[Wang et al.2018]或者交互值[Huang et al.2018]。S={i1,i2,…,i|s|}是一个用户-商品交互序列,其中这里的每一个交互ij=<u,a,v>都包含一个代表用户的u,代表用户行为的a和一个代表对应商品的v。在一些例子中,用户和商品是与一些元数据相联系的(例如,人口统计或特征),尽管这些行为可能有不同的类型(例如,点击,添加到购物车,购买)并发生在多种上下文的情况下(例如,时间,地点,天气)。输出R是通过排名分数提供的商品的列表。
不同于一般的序列模型,在这里的序列结构是简单的,因为这里的一个序列经常是由一些原子元素构成(例如,真实值,基因),序列推荐系统中的一些学习任务多是更具挑战的,应为有更多复杂的序列结构(例如,每一个元素是一个三元组)。这激励我们去系统地分析序列推荐系统中的这种挑战并总结相应的进程。
贡献
本项工作的主要贡献总结如下:
l 我们系统分析了序列推荐系统中由不同的数据特征引起的大量关键挑战,并且从数据驱动的角度对他们进行归类,这就提供了一种新的观点去更加深刻的理解序列推荐系统的特点。
l 我们在技术方面通过对最先进的技术进行系统归类,然后总结了序列推荐系统当前研究的进程。
l 我们分享并讨论了序列推荐系统的一些前景,以便供社会各界参考。
2.数据特征和挑战
在现实世界里,由于用户购物行为、商品特征和特定购物环境的多样性和复杂性,生成的用户-商品交互数据经常有不同的特点。对于序列推荐系统来说,不同的数据特点一般会带来不同的挑战,这也就要求有不同的解决方案,正如表1所示。在接下来的五个小节中,我们具体讨论了序列推荐系统中由不同的数据特点引起的五个关键的挑战。在每一个小节中,我们首先介绍特定数据的特点,然后说明响应的挑战。
2.1 长用户-商品交互序列的处理
一个长用户-商品交互序列包含相当数量的用户-商品的交互。因此,它有很多更好的机会对内部多个交互具有更复杂和更加全面性的依赖关系,这使得序列推荐更具挑战性。具体来说,两个最重要的挑战是学习高阶顺序依赖关系和学习长期顺序依赖关系,以下将分别介绍。
学习高阶顺序依赖关系
高阶顺序依赖关系通常存在于用户-商品交互序列中,尤其是长序列中。与低阶顺序依赖相比,这种方式相当简单,而且它能轻易地通过马尔科夫模型[Garcin et.al.,2013]或因子分解机[Rendel et.at.,2010;Hidasi and Tikk,2016]建模。对于被捕获,因为他们复杂的多水平级联依赖关系交叉多用户-商品交互,所以高阶顺序依赖关系是更加复杂和困难的。到目前为止,已经有两种基本方法在一定程度上能解决顺序推荐系统中的这个挑战:高阶马尔科夫模型[He and McAuley,2016]和循环神经网络[Hidasi et al.,2016a],如表1所示。然而,每一种方法都有自身的限制,例如,包含在高阶马尔科夫模型中的历史状态是相当有限的,因为要被估计的模型参数的数量随着阶数的增长呈现指数型增长,而循环神经网络中的超强假设限制了循环神经网络在序列中应用的灵活性。这两种方法中的技术进展将在第3.1节和3.3节中分别进行详细的介绍。
表1 序列推荐系统中通过数据特点驱动的挑战的总结
学习长期顺序依赖关系
长期顺序依赖关系指的是在一个序列中相互之间相距很远的交互间的依赖关系。例如,给定一个购物序列S1 = {玫瑰花,鸡蛋,面包,一瓶牛奶,一个花瓶},这包含了Janet成功购买的一篮子商品。显而易见,花瓶和玫瑰花是高依赖关系,即使他们之间的相距很远。这种情况在现实中并不少见,因为用户的行为通常是高度不确定的,他们可能会把任何物品放进购物车中。为了解决这种关键的问题,基于长短时记忆和基于门循环单元的循环神经网络已经被应用于顺序推荐系统中了,这种情况下就能捕获序列中用户-商品的交互间的长期以来关系。然而,对于用循环神经网络模型通过过度假设(任何邻近商品在序列中都是高依赖关系)生成错误依赖关系是比较容易发生的。在上面Janet购物的序列中,循环神经网络通常是通过假设牛奶和花瓶是有依赖关系的来构造S1 的,这是由于他们之间的距离很近,但是实际上是不相关的。为了解决这个问题,还做了一些其他的努力,在一个统一的模型中,通过利用混合模型的优势,结合不同时间范围内的多个子模型去捕获短期和长期的依赖关系[Tang et al.,2019]。总的来说,这项工作能够解决的问题相当有限,怒要更多的调查去跨越这一个鸿沟。循环神经网络和混合模型中的技术进展将在3.3节中介绍。
2.2 使用灵活的排序处理用户-商品间的交互
在现实世界中,一些用户-商品间的交互序列是被严格限制的,尽管其他方面可能不是这样,也就是说在一个序列中不是所有的邻近的交互都是顺序依赖的。例如,在一个购物序列S2 = {牛奶,黄油,面粉}中,牛奶或黄油哪一个首先被买是没有关系的,但是这些商品的购买导致了接下来去买面粉的概率会很高;也就是说牛奶和黄油之间没有严格的顺序,但是面粉的顺序会取决于它们的组合。因此,对于一个灵活排序的序列,他能更好地捕获集合顺序依赖项,而不是点式的,因为前者是模糊的,对用户-商品间的交互没有严格的顺序。因此,如何在灵活排序的假设下去捕获集合顺序依赖项成为了使用灵活排序处理用户-商品间的交互这一问题的关键挑战。
尽管这个问题很普遍也很重要,但是序列推荐系统的报道学习还没有引起广泛的关注。现有的顺序推荐系统建立在马尔科夫链上、因子分解机或只能处理点式依赖管的循环神经网络中,但那并不擅长构建和捕获集合依赖项。仅有很少的工作已经开始试图去解决这样的挑战,通过利用卷积神经网络在图片处理中的长处在不同领域中去构造本地和全局的依赖关系。例如,在交互序列中嵌入矩阵。这种基于卷积神经网络的序列推荐系统的技术发展将在3.3节中介绍。
2.3 处理带有噪音的用户-商品交互序列
由于用户购物行为的不确定性,用户-商品间的交互顺序大多是不干净的,这意味着这里边包含了一些噪音和一些会对预测下一步产生干扰的不相关的交互。在实践中,一个用户-商品交互的序列的一些历史交互信息与预测下一步的交互有着密切的关系,其他的内容大多就是弱相关甚至是不相关的。例如,在另一个购物序列S3 = {熏肉,玫瑰,鸡蛋,面包}中这里的‘玫瑰’很有可能是噪音元素,因为它与其他的元素区别很大,与他们间几乎不相关。下一个元素最大概率应该是一瓶牛奶,它的顺序仅取决于熏肉、鸡蛋和面包,即使它与玫瑰没有关系。序列推荐系统中的另一个关键挑战是去认真而且有区别的学习顺序依赖关系,而不是带有噪声的用户-商品间的交互顺序。
有不少工作试图通过利用注意力模型或记忆网络去解决这种典型问题,这些记忆网络可以从那些真正与下一步交互预测相关的信息中有选择地保留和利用信息。这些解决方法的技术发展将在3.3节中进行介绍。
2.4 处理带有异构关系的用户-商品交互序列
异构关系指的是不同类型的关系,这种关系传递不同种类的信息,在序列推荐系统中应该进行不同的建模。例如,在一个用户-商品交互序列中,除了在用户-商品交互中基于普遍发生的顺序依赖关系之外,就其特点而言,还有基于交互项间的相似度的关系。再者而言,尽管这都是顺序依赖关系,但长期顺序依赖关系与短期顺序依赖关系有很大的不同,所以他们不能以同样的方式进行建模。因此,序列推荐系统中的另一个关键挑战是当处理用户-商品交互序列与异构关系的联系时,如何高效的捕获这些异构关系然后分别嵌入到用户-商品间的交互序列中去,并且使它们一起工作,以便可以进行连续的推荐。
文献中对于解决存在于序列推荐系统里的这个问题的记录是非常有限的。离完成这个挑战还很遥远,混合模型[Kang et al.,2018;Tang et at.,2019;Wang et at.,2019]是仅有的解决方案。混合模型集成了通过不同子模型建模得到的不同类型的关系,这可以让它们共同生成推荐序列。这项技术的进展将在3.3节中进行介绍。
2.5 处理带有层次结构的用户-商品交互序列
通常来说,主要有两种层次结构,这两种层次结构大多与用户-商品交互顺序有关:(1)元数据和用户-商品间交互的异构结构。具体来说,用户的人口统计数据在一定程度上能决定用户的喜好,也能进一步影响他们与商品间的交互。类似的,商品的特征经常在用户是否会喜欢或与用户是否会相互影响等方面有一些影响[Hidasi et al., 2016b];(2)子序列和用户-商品间交互的层次结构。更具体的说是在序列推荐系统中,一个用户-商品间的交互包含了多个子序列(也被称为会话)。在一些例子里,除了当前子序列优先交互之外,历史子序列也可能影响在当前子序列中预测下一步用户-商品间的交互[Ying et al., 2018]。因此在序列推荐系统中一个更关键的挑战是如何将嵌入在这两种层次结构中的层次依赖关系合并到顺序依赖关系中,然后学习生成更加精确地序列建议。
尽管不少工作已经开始尝试在主要方面解决这个问题,但在其他的方面还是很少有研究。一方面,考虑到商品特征在用户-商品间交互的影响, 一系列针对序列推荐系统的特征丰富的自然模型已经被提出了,包括[Hidasi et al., 2016b]。相比较而言,用户的人口统计数据的影响在现有的序列推荐系统中已经很少被考虑,应该向这个方向作更多的努力。另一方面,包含层次嵌入模型[Wang et al., 2015]、层次循环神经网络[Quadranaetal.,2017]和层次注意力网络[Ying et al., 2018]在内的一些层次模型已经被设计用于合并历史子序列到序列依赖关系中,以便建立更加权威的序列推荐系统。对于解决这个问题的技术发展将在3.2节和3.3节中介绍。
3 研究进展
为了概述序列推荐系统的技术进展,并给出更多对于前述挑战解决方法的技术细节,我们在此节中从技术角度总结并简单讨论了序列推荐系统中的研究进展。特别说明的是,我们首先从技术角度对序列推荐系统的所有方法进行了分类展示,然后简单强调了每一个类别中方法的当前进展。
序列推荐系统中方法的类别如图2所示。从技术角度来说我们观察到对于序列推荐系统的多种方法首先被分为了11个原子类(例如,序列模式挖掘,因子分解机,循环神经网络)。所有这些院子类别将进一步被分为三个大类,包括传统序列模型,潜在表征模型,深度神经网络模型。一般来说,这三个类的顺序是从简单到复杂来连续说明的。接下来我们将对这三个类别的研究进展进行逐一总结。
图2 从技术角度对序列推荐系统方法的分类
3.1 序列推荐系统的传统序列模型
包含序列模式挖掘和马尔可夫链模型在内的传统序列模型是比较简单直观的解决方式,这种方式通过利用序列推荐系统的自然优势在一个序列中对用户-商品间的交互建立顺序依赖关系。
序列模式挖掘。基于序列模式的推荐系统首先在序列数据上挖掘频繁模式,接着利用挖掘出的模式去指导后续的推荐。尽管简单且直接,但是序列模式挖掘通常会生成大量的冗余模式,那增加了时间和空间的不必要的消耗。另一个明显的缺点是它经常丢弃罕见的模式和由于频繁约束的元素,这就限制了对流行的商品推荐结果。因此,出了一篇有代表性的著作[Yap et al., 2012]以外,这门课几乎没有报道过什么作品了。
马尔可夫链模型。基于马尔科夫链的推荐系统采用马尔可夫链模型去建立序列中用户-商品间交互的转换,以便下一步交互的预测。根据使用技术的不同,基于马尔科夫链的推荐系统被分成两种,一种是基于基础马尔科夫链的方法,另一种是基于潜在马尔科夫嵌入的方法。前一种方法直接计算基于显示观测到的转换概率[Garcinetal.,2013],尽管是后者首先将马尔科夫链嵌入到欧式空间,并且计算了基于欧式空间距离的交互间的转换概率[Feng et al., 2015]。基于马尔科夫链的推荐系统的缺点是显而易见的,也就是说,在一方面,由于马尔可夫假设当前的交互仅取决于一个或最近的几个交互,所以它们只能捕获短时依赖关系而忽略掉长时的依赖关系;另一方面,在用户-商品交互中,它们仅能捕获点式依赖关系而忽视掉协同依赖关系。所以,在近几年它们在序列推荐系统中应用的越来越少。
3.2 序列推荐系统中的潜在表征模型
潜在表征模型首先学习一个用户或者商品的潜在表征,然后利用这个学习到的潜在表征去预测后续的用户-商品交互。因此,更多隐性和复杂的依赖关系在一个潜在空间中被捕获,这极大地改善了推荐系统的推荐功能。接下来,我们介绍这个类别中的两种表征模型。
因子分解机。基于因子分解机的序列推荐系统通常利用矩阵因子或张量矩阵将观察到的用户-商品的交互分解为潜在的用户和商品因子以便推荐[Rendle et al., 2010; Hidasi and Tikk, 2016]。不同与协同过滤,矩阵或张量成为的因子是由交互组成的,而不是昔日通过了初中的评估。这样的模型是容易因观察到的数据的稀疏性而影响的,因此无法实现理想的推荐。
嵌入式。基于嵌入式的序列推荐系统在一个潜在空间中为每一个用户和商品学习一个潜在表征,通过编码一个序列中所有的用户-商品的交互来给出随后的推荐建议。尤其要说明的是,一些著作中采用将这个学习到的潜在表征作为神经网络的输入去进一步的计算用户和商品或者用户连续的行为的交互值[Wang et al., 2015; 2018],而其他的工作直接利用它们去计算像欧氏距离这样的度量作为交互值[He et al., 2018]。
3.3 序列推荐系统中的深度神经网络
深度神经网络对于在一个序列中的不同实体间(例如,用户,商品,交互)构建和捕获综合关系有自然优势,因此在过去的几年里它们几乎主导了序列推荐系统。序列推荐系统中取得的最新进展也属于这个类别。通常来说,这个类别可以被分成两个子类别:基于基础深度神经网络的序列推荐系统和基于带有先进模型的深度神经网络的序列推荐系统。
基础深度神经网络
对于序列推荐系统来说,最常用的深度神经网络模型是循环神经网络,这是由于它们在序列模型中的自然优势决定的,但它们也有缺陷。不久前卷积神经网络和图神经网络也被应用于序列推荐系统,以此来弥补循环神经网络中的不足。接下来,我们分别介绍基于三个深度神经网络的序列推荐系统。
基于循环神经网络的序列推荐系统。给定一个用户-商品交互的历史序列,基于循环神经网络的序列推荐系统试图通过给定的交互建立一个序列依赖关系,以此预测接下来可能的交互。除了针对基础循环神经网络之外,基于长短期记忆[Wu et al., 2017]和门循环控制单元[Hidasi et al., 2016a]的循环神经网络也被用于在一个序列中捕获长期依赖关系。近年来,已经见证了基于循环神经网络的序列推荐系统或者说是整个序列推荐系统的繁荣。除了基础循环神经网络结构,一些循环神经网络的变体在一个序列中能捕获更加复杂的像层级循环神经网络[Quadrana et al., 2017]这样的依赖关系。然而,循环神经网络不适合序列推荐系统,这是应为循环神经网络在两方面有些不足:(1)由于超强假设:在序列中任何邻近的交互一定是依赖的,所以它很容易生成错误的依赖关系,或许在现实世界中并不存在这样的例子,因为在序列内部通常是不相关的或是杂乱的交互;(2)当忽略了协作依赖关系,它就很容易只捕获点式的依赖关系(例如,一些交互协作会影响下一个内容)。
基于卷积神经网络的序列推荐系统。不同于循环神经网络,给定一个用户-商品交互的顺序,卷积神经网络首先将所有交互嵌入到矩阵中,接着在时间和潜在空间中将此矩阵视为一张图片。最后,卷积神经网络学习这个序列模式作为这张图片的本地特征,使用卷积过滤以便后续的推荐。因为卷积神经网络在序列的交互中没有强序假设,并且它们学习的是图像区域间的模式而不是交互间的,因此,基于卷积神经网络的序列推荐系统在一定程度上能弥补上述基于循环神经网络的序列推荐系统的缺点。然而。由于卷积神经网络使用这种过滤有大小限制,所以基于卷积神经网络的序列推荐系统不能高效的捕获长期依赖关系,这就限制了它的应用。这个典型的工作有[Tang and Wang, 2018; Yuan et al., 2019]。
基于图神经网络的序列推荐系统。随着图神经网络的高速发展,基于图神经网络的序列推荐系统已经被设计,它利用图神经网络去建模和捕获序列中更复杂的用户-商品间交互的转换。当每一个序列被映射到路径上时,有向图首先建立在序列数据之上,并将每一个交互作为图中的一个节点。然后,在图上学习用户或商品的嵌入,以便在整个图中嵌入更复杂的关系[Wu et al., 2019]。这种方法充分利用了图神经网络的优势,能够捕获结构关系数据集中复杂的关系。基于图神经网络的序列推荐系统已经展示了一个巨大的潜能,它能通过揭示推荐的商品和相应序列的上下文间的复杂关系,以此来提供一个可解释的推荐。这种序列推荐系统仍然处于早期阶段。
高级模型
为了解决基于基础神经网络结构的序列推荐系统的限制,一些高级模型通常与一类基本的深度神经网络(例如,循环神经网络,卷积神经网络)结合在一起,以此来建立更加权威的序列推荐系统,这种推荐系统能够解决一些特殊的挑战。接下来,我们介绍三个常用于序列推荐系统的高级模型。
注意力模型。注意力模型在序列推荐系统中常被用于强调序列中那些真正的相关和重要的交互,同时淡化那些与下一步交互无关的内容。它们被广泛的合并到浅层网络和循环神经网络中,以便处理有噪音的交互序列。
记忆网络。在序列推荐系统中引入记忆网络,通过合并外部记忆矩阵,可以直接捕获每个历史用户-商品交互和下一个交互间的依赖关系。这样的矩阵可以更显式和动态地存储和更新序列中的历史交互,以提高模型的表达能力,并减少这些不相关的交互的干扰[Chenetal.,2018]。此外,一些工作还结合了一个键值存储网络,将交互项的相应知识库信息按顺序存储和更新,以学习属性级偏好以增强推荐[Huang et al., 2018]。通常来说,记忆网络已经在序列推荐系统中展示了其潜能,但是还没有被充分地研究。
混合模型。基于混合模型的序列推荐系统结合了不同的擅长捕获不同种类依赖关系的模型,以此来强化整个模型在捕获多种依赖关系方面的能力,以便给出更好的推荐。一个典型的例子是[Tangetal.,2019],它结合了分别适合于短期和长期依赖关系的不同种类的编码器,以此去学习更加精确的序列表征,这对序列推荐及其论证相当有效。然而,这些模型处于早期阶段。
4 开放式研究方向
近些年来,尤其是近三年里,随着深度学习尤其是循环神经网络的成功,已经见证了序列推荐系统的快速发展。在本文中归类和总结研究实践的同时,我们也已经确定了下面讨论的进一步开放式的研究方向。
上下文感知序列推荐系统。用户或商品所在的当前上下文可能会极大地影响用户对商品的选择,当提出建议时应该考虑到这一点。这在序列推荐系统甚至会更加必要,因为随着时间的推移,上下文可能会改变。然而,大多数现存的序列推荐系统都忽视了这个重要的方面。因此,上下文感知序列推荐系统在未来的工作中将成为一个重要的研究方向。
社交感知序列推荐系统。用户生活在社会中,通过网络或工作与各种各样的人建立联系。其他人的行为或观点经常会极大地影响用户的选择。因此,在序列推荐系统中需要考虑社交的影响,这在现有的工作中经常被忽略。
交互式序列推荐系统。在现实中大多数购物行为都是连续的,而非独立的事件。换句话说,这事实上是用户和购物平台(例如,亚马逊)之间的序列交互。然而,现有的序列推荐系统经常忽视这样的交互,并且它们生成的推荐在一个时间步内只生成一个行为。如何合并用户-卖家间的交互,并生成多时间步长的推荐是一个很有前途的研究方向。
跨域序列推荐系统。在现实世界里,用户在一定时间内购买的商品通常是来自多个领域,而非单个领域。基本上都是一些来自不同领域的商品间的序列依赖关系,例如买车之后车险的购买。这种跨域序列依赖关系在大多数序列推荐系统中被忽视。因此,跨域序列推荐系统对于通过利用不同领域的信息生成的更加精确地推荐和来自不同领域的多样的推荐是另一个比较有前途的研究方向,
5 总结
推荐系统是人工智能在我们生活中最直接和最实用的应用之一。序列推荐系统在过去的三年到五年里已经成为推荐系统领域的核心,因为它们提供了更加智能和更受喜爱的建议,以此来满足我们日常的需求。我们希望这篇序列推荐系统的总结能为推荐系统研究界提供一个关于挑战、近期进展和未来方向的综述。
致谢
这项工作得到了澳大利亚研究委员会的部分支持,项目DP为180102378。
参考文献
[Chen et al., 2018] Xu Chen, Hongteng Xu, Yongfeng Zhang, and et al. Sequential recommendation with user memory networks. In Proceedings of the 11th ACM International Conference on Web Search and Data Mining, pages 108–116, 2018.
[Feng et al., 2015] Shanshan Feng, Xutao Li, Yifeng Zeng, Gao Cong, and Yeow Meng Chee. Personalized ranking metric embedding for next new poi recommendation. In Proceedingsofthe 24thInternationalJointConferenceon Artificial Intelligence, pages 2069–2075, 2015.
[Garcin et al., 2013] Florent Garcin, Christos Dimitrakakis, andBoiFaltings. Personalizednewsrecommendationwith context trees. In Proceedings of the 7th ACM Conference on Recommender Systems, pages 105–112, 2013.
[He and McAuley, 2016] Ruining He and Julian McAuley. Fusing similarity models with markov chains for sparse sequential recommendation. In Proceedings of the 16th IEEE International Conference on Data Mining, pages 191–200, 2016.
[He et al., 2018] RuiningHe,Wang-ChengKang,andJulian McAuley. Translation-based recommendation: A scalable method for modeling sequential behavior. In Proceedings ofthe27thInternationalJointConferenceonArtificialIntelligence, pages 5264–5268, 2018.
[Hidasi and Tikk, 2016] Bal´azs Hidasi and Domonkos Tikk. General factorization framework for context-aware recommendations. Data Mining and Knowledge Discovery, 30(2):342–371, 2016.
[Hidasi et al., 2016a] Bal´azs Hidasi, Alexandros Karatzoglou, and et al. Session-based recommendations with recurrentneuralnetworks. InProceedingsofthe4thInternational Conference on Learning Representations, pages 1–10, 2016.
[Hidasi et al., 2016b] Bal´azs Hidasi, Massimo Quadrana, Alexandros Karatzoglou, and Domonkos Tikk. Parallel recurrent neural network architectures for feature-rich session-based recommendations. In Proceedings of the 10th ACM Conference on Recommender Systems, pages 241–248, 2016.
[Huang et al., 2018] Jin Huang, Wayne Xin Zhao, Hongjian Dou, Ji-Rong Wen, and Edward Y Chang. Improvingsequentialrecommendationwithknowledge-enhanced memorynetworks. InProceedingsofthe41stACMSIGIR Conference on Research & Development in Information Retrieval, pages 505–514, 2018.
[Kang et al., 2018] Wang-Cheng Kang, Mengting Wan, and Julian McAuley. Recommendation through mixtures of heterogeneous item relationships. In Proceedings of the 27th ACM International Conference on Information and Knowledge Management, pages 1143–1152, 2018.
[Quadrana et al., 2017] Massimo Quadrana, Alexandros Karatzoglou, and et al. Personalizing session-based recommendations with hierarchical recurrent neural networks. In Proceedings of the 11th ACM Conference on Recommender Systems, pages 130–137, 2017.
[Rendle et al., 2010] Steffen Rendle, Christoph Freudenthaler, and Lars Schmidt-Thieme. Factorizing personalized markov chains for next-basket recommendation. In Proceedings of the 19th International Conference on World Wide Web, pages 811–820, 2010.
[Tang and Wang, 2018] Jiaxi Tang and Ke Wang. Personalized top-n sequential recommendation via convolutional sequence embedding. In Proceedings of the 11th ACM International Conference on Web Search and Data Mining, pages 565–573, 2018.
[Tang et al., 2019] Jiaxi Tang, Francois Belletti, Sagar Jain, Minmin Chen, Alex Beutel, and et al. Towards neural mixture recommender for long range dependent user sequences. In Proceedings of the 28th International Conference on World Wide Web, pages 811–820, 2019.
[Wang et al., 2015] Pengfei Wang, Jiafeng Guo, Yanyan Lan,JunXu,ShengxianWan,andXueqiCheng. Learning hierarchical representation model for next basket recommendation. In Proceedings of the 38th ACM SIGIR Conference on Research and Development in Information Retrieval, pages 403–412, 2015.
[Wang et al., 2018] Shoujin Wang, Liang Hu, Longbing Cao,XiaoshuiHuang,DefuLian,andWeiLiu. Attentionbased transactional context embedding for next-item recommendation. In Proceedings of the 32nd AAAI Conference on Artificial Intelligence, pages 2532–2539, 2018.
[Wang et al., 2019] Shoujin Wang, Liang Hu, Yang Wang, and et al. Modeling multi-purpose sessions for nextitem recommendations via mixture-channel purpose routing networks. In Proceedings of the 28th International Joint Conference on Artificial Intelligence, pages 1–7, 2019.
[Wu et al., 2017] Chao-Yuan Wu, Amr Ahmed, Alex Beutel, Alexander J Smola, and How Jing. Recurrent recommender networks. In Proceedings of the 10th ACM International Conference on Web Search and Data Mining, pages 495–503, 2017.
[Wu et al., 2019] Shu Wu, Yuyuan Tang, and et al. Sessionbased recommendation with graph neural networks. In Proceedings of the 33rd AAAI Conference on Artificial Intelligence, pages 1–9, 2019.
[Yap et al., 2012] Ghim-EngYap,Xiao-LiLi,andPhilipYu. Effective next-items recommendation via personalized sequential pattern mining. In Database Systems for Advanced Applications, pages 48–64, 2012.
[Ying et al., 2018] Haochao Ying, Fuzhen Zhuang, Fuzheng Zhang,YanchiLiu,GuandongXu,andXingXie. Sequential recommender system based on hierarchical attention networks. In Proceedings of the 27th International Joint Conference on Artificial Intelligence, 2018.
[Yuan et al., 2019] Fajie Yuan, Alexandros Karatzoglou, Ioannis Arapakis, Joemon M Jose, and Xiangnan He. A simpleconvolutionalgenerativenetworkfornextitemrecommendation. In Proceedings of the 12th ACM International Conference on Web Search and Data Mining, pages 582–590, 2019.