p1 Why l like it: Multi-task Learning for Recommendation and Explanation

今天,是正式开始精读第一篇文章,关注了一个公众号:paper weekly,每周必读论文。

摘要:我们描述了一种优秀的多任务推荐模型,它使用矩阵分解去排名预测,并且联合对抗性seq2seq学习去生成推荐解释。实验结果是利用真实数据集去展示相比于业内普遍水平的排名预测的性能提升,同时也能产生出有效的个性化的推荐解释。关键字:推荐系统,自然语言生成,信息提取,联合推荐,个性化。

个性化推荐系统都是在慢慢学习如何去度量用户对一个item的喜爱程度,从商业角度来看,这能帮助用户更好的做出购买选择并且带动销售量,抓住用户。协同过滤是一个被普遍接受的推荐方法。它通过从很多用户手中收集各种认购信息和评价,形成属性偏好信息,预测用户兴趣爱好。这种方式比较倚重user-item ratings,但是不可避免带来稀疏性,从而限制预测的精确度。现如今的CF算法试着挖掘潜在特征来表示用户,物品,这相应的会带来推荐系统的透明性缺失。(应该意思是指需要用户来参与信息填写吧,可能多少会带来一些用户的不方便,因为需要他们的参与。下面就说了,这种问题可能对于电子商务网站来说会变得比较棘手因为潜在特征不太容易被标记,那么问题非电子商务网站就会容易标记吗?)为了建立起用户对推荐系统的信任,那么推荐的可解释性就变得很重要。(为什么,我不需要知道啊,只要他能推荐的好就可以,至于怎么推荐的我希望透明度高些)

为了提高推荐精确度和可解释性,系统多利用用户自己产生的评论,把这些评论作为资源来产生推荐数据。如今,通过用户评论来自动挖掘观点是可行的,它可以辅助用户偏好设置以及产品特征描述,即使user-item评价很少,但这些自动挖掘出的观点能反映出隐形特征,影响用户的决策(user-item信息和opinions有什么区别 ??我理解这个opinion是通过深度学习生成的,而非用户自然 产生的)所以不意外,好多研究者就把重点放在了挖掘用户产生的评论潜力以此来提升推荐性能(是我理解不对吗,不是一直在这样做吗?auxiliary 辅助的 auxiliary information)同时为了提供可解释推荐,最近,评价生成也变得很热门。用户自己生成的评价至少可以作为用户提供的排名的解释。

重点来了,介绍本文的内容了。在这文章里,我们提出了一个新奇的多任务学习框架,通过用户产生的评论,联合完成排名预测和推荐解释的学习。(原文 jointly learns to perform rating prediction and recommendation explanation from user-generated reviews)传统的推荐解释有一个严重的局限性因为它只能学习肉眼可见的评论里明确描述出的用户偏好设置和item属性。(强调的很明确,since it can only learn user preferences and item properties that are explicitly stated in obser ed reviews)还有一点值得注意,协同过滤技术能发现不明确的用户兴趣点,通过用户对某个商品的反馈,例如点击或者是排名;所以我们的解释生成过程处理是通过协同过滤模型加强过得,以此来揭示出潜在的影响用户决策的因素即使用户从来没有暗示过。此外,我们比较倾向于推荐解释和预测要一起产生,这就有效地是的模型合法化并且在没遇到过的测试数据集上也能表现很好,(最后,联合优化推荐及解释能带来两者之间的一致性)

(In what follows,we will接下来,我们将。。。句子感觉很好)接下来我们将展示我们怎么把矩阵分解和seq2seq结合起来。简单说来,我们利用矩阵分解模型来预测排名,用seq2seq学习模型来生成解释,构造成一个用户、系统学习生成的关于给定推荐的个性化评价 的键值对(??)。由矩阵分解学习到的潜在特征向量和由seq 自动编码器生成的文本向量肯定存在重叠,我们允许单个的不同模型可以将两者都合法化。(矩阵分解预测排名,是指用机器学习的手法来预测一组序列吗?由seq自动编码器生成文本向量可以想象,使用深度学习算法模型,通过输入一些键值对来训练模型生成用户对某一item应该有怎么样的评价,这两个量之间是怎么存在重叠的呢?一个是rating prediction,一个是textual features???)

Related Work:

一些论文提到去优化扩展当前潜在特征模型和自然语言处理进程,做法多是将观点挖掘和多任务学习框架结合。潜在特征模型是推荐系统研究普遍涉及到的领域。他们将用户偏好和item属性用设定好的多为向量编码来表示用户和 item。矩阵分解,是进行潜在特征向量建模时常用的一类方法。但存在稀疏性问题和透明度问题。有很多论文也提出了多种方案来解决这些问题,(说一个比较感兴趣的)Deep Cooperative Neural Networks model 它建立关于用户-物品的模型,基于review texts,利用两层卷积神经网络的因子分解机模型。(什么是review texts,可以扩展阅读一下);还有一个transNets 模型扩展了上面提到的卷积神经网络,加了一层,这一层是正则化过的?(regularized by the latent representation of review texts)

最近,seq2seq深度学习神经网络模型已经被用到很多领域了,包括文本摘要、问答系统等,研究者还发现了调用序列自动编码器的seq2seq学习模型可以用来完成诸如语义分析,主题建模等任务。这些模型同样也可以用来生成客户评价,以此来解决推荐解释问题。例如,有人就提出了学习生成个性化的评论以及评价分数opinion 推荐模型。

收到GAN对抗生成网络在机器视觉方面成就的影响,近些年,自然语言处理的对抗训练方法已经很多人在开发训练了。这些对抗训练模型也都表现出优异的性能。特别是自然语言生成。比如SeqGAN模型介绍了一种策略梯度算法(policy gradient approach),能有效训练序列生成对抗网络。

好了,我要去看cnn rnn lstm去了。下篇继续

 

posted @ 2019-03-29 20:50  Rita2008  阅读(154)  评论(0编辑  收藏  举报