【读论文】-- 推荐系统研究综述
前言
本文题目为《推荐系统研究综述》,文章发表在河北科技大学学报(Journal of Hebei University of Science and Technology),文章发表时间是:2020年年2月。
摘要
摘要原文
随着互联网技术的快速发展,如何对海量网络信息进行挖掘分析,已成为热点和难点问题。推荐系统能够帮助用户在没有明确需求或者信息量巨大时解决信息过载的问题,为用户提供精准、快速的业务(如商品、项目、服务等)信息,成为近年来产业界和学术界共同的兴趣点和研究热点,但是,目前数据的种类多种多样并且应用场景广泛,在面对这种情况时,推荐系统也会遇到冷启动、稀疏矩阵等挑战。深度学习是机器学习的一个重要研究领域和分支,近年来发展迅猛。研究人员使用深度学习方法,在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。目前,深度学习在推荐领域也得到了许多研究人员的青睐,成为推荐领域的一个新方向。推荐方法中融合深度学习技术,可以有效解决传统推荐系统中冷启动、稀疏矩阵等问题,提高推荐系统的性能和推荐精度。
文中主要对传统的推荐方法和当前深度学习技术中神经网络在推荐方法上的应用进行了归纳,其中传统推荐方法主要分为以下3类:1)基于内容推荐方法主要依据用户与项目之间的特征信息,用户之间的联系不会影响推荐结果,所以不存在冷启动和稀疏矩阵的问题,但是基于内容推荐的结果新颖程度低并且面临特征提取的问题。2)协同过滤推荐方法是目前应用最为广泛的一种方法,不需要有关用户或项目的信息,只基于用户和诸如点击、浏览和评级等项目的交互信息做出准确的推荐。虽然该方法简单有效但是会出现稀疏矩阵和冷启动的问题。3)混合推荐方法融合了前2种传统推荐方法的特点,能取得很好的推荐效果,但在处理文本、图像等多源异构辅助信息时仍面临一些挑战与困难。
依据神经网络基于深度学习的推荐方法主要分为4类:基于深度神经网络(DNN)的推荐方法、基于卷积神经网络(CNN)的推荐方法、基于循环神经网络(RNN)和长短期记忆神经网络(LSTM)的推荐方法、基于图神经网络(GNN)的推荐方法、将深度学习技术融入到推荐领域,构造的模型具有以下优势:具有较强的表征能力,可以直接从内容中提取用户和项目特征;具有较强的抗噪能力,可以轻易地处理含有噪声的数据;可以对动态或者序列数据进行建模;可以更加精准地学习用户或项目特征;便于对数据进行统一处理,并且可以处理大规模数据。将深度学习技术应用到推荐领域,可以积极有效地应对传统推荐方法面临的挑战,提高推荐效果。
分析
摘要可分为三段:
- 第一段:
- 提出问题:随着互联网技术的快速发展,如何对海量网络信息进行挖掘分析,已成为热点和难点问题。
- 提出针对上述问题的解决方式:推荐系统,并列举出其缺点;
- 提出基于深度学习的推荐系统,与此同时指出,推荐系统+深度学习是新的研究方向
- 第二段:
- 归纳了传统的推荐方法和当前深度学习技术中神经网络在推荐方法上的应用
- 分类:传统的推荐系统分类分为三类:
- 基于内容的推荐系统
- 协同过滤推荐系统
- 混合推荐系统
- 介绍三种传统推荐系统的优缺点
- 第三段:
- 依据神经网络基于深度学习的推荐方法的分类(分为四类)
- 基于深度神经网络(DNN)的推荐方法
- 基于卷积神经网络(CNN)的推荐方法
- 基于循环神经网络(RNN)和长短期记忆神经网络(LSTM)的推荐方法
- 基于图神经网络(GNN)的推荐方法
- 将深度学习技术融入到推荐领域,构造模型的优势由:
- 具有较强的表征能力
- 具有较强的抗噪能力
- 可以对动态或者序列数据进行建模
- 可以更加精准地学习用户或项目特征
- 便于对数据进行统一处理,并且可以处理大规模数据
- 将深度学习技术应用到推荐领域,可以积极有效地应对传统推荐方法面临的挑战,提高推荐效果。
- 依据神经网络基于深度学习的推荐方法的分类(分为四类)
好了,现在对这篇文章有了结构性的认识,接下来让我们进入正文,详细了解一下,关于推荐系统的研究进展。
传统推荐系统
在20世纪90年代,推荐系统发展成为一门独立的学科,推荐系统的核心部分是推荐算法,推荐算法根据用户与项目之间的关系帮助用户发现其感兴趣的项目。
推荐算法的定义: 定义函数s 来计算一个项目i∈I(I 代表所有项目的集合),推荐给某一位用户u∈U(U 代表所有用户的集合)的可能性 P,推荐算法就是通过计算 P 来为用户找到其最感兴趣的项目i′∈I,即对于任意的u ∈U,i′u =argmaxs(u,i),i∈I 。
传统的推荐方法主要分为3类:
- 基于内容的推荐(content-based recommendation)方法
- 基于协同过滤的推荐方法(collaborative filtering recommendation)
- 和混合推荐方法(hybrid recommendation)
基于内容的推荐
基于内容的推荐方法是最早被使用的推荐算法,来自于信息获取领域。基于内容的推荐方法的思想非常简单,就是向用户推荐与他们过去兴趣相似的项目。
基于内容的推荐建立在项目信息基础上做出推荐,需要从关于内容特征描述的事例中得到用户的兴趣资料,然后根据用户偏好和项目特征信息产生推荐结果。这种方法的优点是能对具有小众口味的用户产生有效推荐,在一些特定的场景下表现良好;对于新添加的项目,系统只需要提取新项目的特征即可产生推荐结果,不存在项目冷启动的问题,其缺点在于十分依赖于项目所标记的属性特征,对标记特征要求较高。此外,该方法无法衡量待推荐项目品质的优劣,推荐失败的概率也很高。
基于协同过滤的推荐
GOLDBERG等在1992年提出协同过滤推荐方法,又称为社会过滤,是指筛选出特定用户感兴趣的项目集合,根据这些项目集合挖掘用户的潜在需求,辅助用户做决定。在推荐领域,协同过滤推荐算法是研究的主流方向,也是目前使用最广泛的推荐方法。
用户的历史行为数据是基于协同过滤推荐算法生成推荐项的来源,协同过滤是建立在这样的假设基础上的,如果用户X和Y对t个项目进行相似的评分,或者有相似的行为,那么用户就会对其他项目进行类似的评分或行为。
基于协同过滤的推荐方法主要分为基于用户(user-based)的协同过滤和基于项目(item-based)的协同过滤。
基于用户的协同过滤
首先根据用户偏好计算用户之间的相似度,找出与目标用户相似度高的用户,然后预测出目标用户对相似用户感兴趣物品的评分,最后将评分最高的若干个物品推荐给用户。
基于项目的协同过滤
基于项目的协同过滤与基于用户的协同过滤类似,通过计算物品之间的相似度来进行推荐。计算已购买物品i和待推荐物品j之间相似度的基本思想是:首先提取出对2个物品共同做出评分的用户,如果这些用户对2个物品i和j的评分相近,那么2个物品相似度就高,反之则相似度就低,之后将相似度高的待推荐物品放入推荐列表。协同过滤算法的基础思想如图3所示。由于在淘宝等电商网站中用户数量总是远多于商品的数量,因此在实际应用中基于物品的协同过滤比基于用户的协同过滤更受欢迎。协同过滤推荐方法使用方便、简单,只依据用户的历史评分数据计算用户之间的相似度即可,但是在很多情况下常常遇到评分数据不足造成稀疏矩阵的问题和新用户没有项目评分数据的冷启动问题。
混合推荐
2024-04-11 20:27:42 星期四 今天就先到这了,明天继续!!!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步