Hybrid Recommender Systems: Survey and Experiments
推荐系统代表用户的偏好,目的是建议
购买或检查的物品。它们已经成为了
电子商务和信息访问,提供建议
有效地删除大的信息空间,这样用户就可以被定向到那些
最能满足他们需求和偏好的物品。各种各样的技术
被提议执行推荐,包括基于内容的,
协作、知识和其他技术。为了提高性能,
这些方法有时被混合在混合推荐中。这
论文调查了实际和可能的混合推荐的情况
介绍
推荐系统最初被定义为“人们提供建议作为输入的系统”
然后系统汇总并指向适当的接收者“(Resnick&Varian 1997)。这个词现在有一个
更广泛的内涵,描述任何产生个性化建议作为输出或具有效果的系统
在可能的选项的大空间中以个性化的方式引导用户到有趣或有用的对象。这样
在一个环境中,系统具有明显的吸引力,在这种环境中,在线信息量远远超过任何数据
个人调查它的能力。推荐系统现在是一些电子商务网站的组成部分,如
Amazon.com和CDNow(Schafer,Konstan&Riedl,1999)。
这是将推荐系统与之分开的“个性化”和“有趣且有用”的标准
信息检索系统或搜索引擎。搜索引擎的语义是“匹配”:系统是
应该返回匹配按匹配程度排序的查询的所有项目。相关性等技术
反馈使搜索引擎能够改进其用户查询的表示,并代表一种简单的形式
建议。下一代搜索引擎Google1模糊了这种区别,融入了“权威性”
标准进入其排名(递归地定义为链接到给定页面的页面的权威性的总和)
为了获得更有用的结果(Brin和Page,1998)。
推荐系统研究的一个共同点是需要将推荐技术结合起来
达到最佳表现。所有已知的推荐技术都有优点和缺点,而且很多
研究人员选择以不同的方式结合技术。本文调查了不同的建议
正在研究的技术 - 根据支持建议的数据进行分析
对该数据进行操作的算法 - 并检查已提出的杂交技术的范围。
该分析指出了一些尚未探索的可能的杂种。最后,我们讨论如何添加
混合协同过滤提高了我们基于知识的推荐系统Entree的性能。
此外,我们表明系统的基于知识的部分提供的语义评级提供了一个
进一步提升了混合动力车的性能
推荐技术
推荐技术有许多可能的分类(Resnick&Varian 1997; Schafer,Konstan&
Riedl 1999; Terveen&Hill,2001)。在此讨论中感兴趣的不是接口类型或接口的属性
用户与推荐者的交互,而不是推荐所依据的数据来源和
用于将数据放入其中。具体而言,推荐系统具有(i)背景数据,即信息
系统在推荐过程开始之前,(ii)输入数据,用户必须与之通信的信息
系统以产生推荐,以及(iii)将背景和输入数据组合的算法
得出它的建议。在此基础上,我们可以区分五种不同的推荐技术,如图所示
表I.假设我是可以在其上建议的项目集合,U是用户的集合
偏好是已知的,u是需要为其生成推荐的用户,我是其中的一些项目
我们想预测你的偏好。
协作推荐可能是最熟悉,最广泛实施和最成熟的
技术。协作推荐系统汇总对象的评级或建议,识别
用户之间的共性基于他们的评级,并基于用户间生成新的推荐
比较。协作系统中的典型用户配置文件包含项目向量及其评级,
随着用户随时间与系统交互而不断增强。一些系统使用基于时间的折扣
评级用于解释用户利益的漂移(Billsus&Pazzani,2000; Schwab,et al.2001)。在某些情况下,评级
可以是二元的(喜欢/不喜欢)或表示偏好程度的实值。一些最重要的系统
使用这种技术的是GroupLens / NetPerceptions(Resnick et al.1994),Ringo / Firefly(Shardanand&Maes,
1995),Tapestry(Goldberg等人1992)和Recommender(Hill等人1995)。这些系统可以是基于存储器的,使用相关或其他措施直接比较用户,或基于模型,其中a
模型源自历史评级数据并用于进行预测(Breese等,1998)。基于模型
推荐人使用了各种学习技术,包括神经网络(Jennings&Higuchi,1993),
潜在语义索引(Foltz,1990)和贝叶斯网络(Condliff,et al.1999)。
协作技术的最大优势在于它们完全独立于任何机器可读性
表示推荐的对象,适用于音乐和电影等复杂对象
味道的变化导致偏好的大部分变化。 Schafer,Konstan&Riedl(1999)
称之为“人与人之间的关联”。