摘要:
逻辑回归(LR) 在介绍FM系列之前,我想首先简单介绍一下逻辑回归。通常来说,逻辑回归模型能够综合利用更多的信息,如用户、物品、上下文等多种不同的特征,生成更为全面的结果。另外,逻辑回归将推荐问题看成一个分类问题。通过预测正样本的概率对物品进行排序,这里的正样本可以是用户观看了某个视频,也可以是用户 阅读全文
摘要:
前言 推荐系统实践那本书基本上就更新到上一篇了,之后的内容会把各个算法结合着《深度学习推荐算法》这本书拿来当专题进行讲解。在这一篇,我们将会介绍矩阵分解这一方法。一般来说,协同过滤算法(基于用户、基于物品)会有一个比较严重的问题,那就是头部效应。热门的物品容易跟大量的物品产生相似性,而尾部的物品由于 阅读全文
摘要:
什么是冷启动问题 如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。冷启动问题主要分为三类: 用户冷启动 物品冷启动 系统冷启动 下面我们将分别介绍这三种冷启动情况。 用户冷启动 用户冷启动主要解决如何给新用户做个性化推荐的问题。当新用户到 阅读全文
摘要:
用户行为数据的二分图表示 用户的购买行为很容易可以用二分图(二部图)来表示。并且利用图的算法进行推荐。基于邻域的模型也可以成为基于图的模型,因为基于邻域的模型都是基于图的模型的简单情况。我们可以用二元组$(u,i)$来表示用户$u$对物品$i$有过购买行为,这样的话数据集可以用一个二分图来表示。我这 阅读全文
摘要:
隐语义模型(LFM) LFM(latent factor model)隐语义模型是前几年比较火的模型,它的核心思想是通过隐含特征来联系用户兴趣和物品。我们先给出LFM通过公式计算用户$u$对物品$i$的兴趣: \[ \mathrm{Preference} = r_{ui} = p_u^T q_i=\ 阅读全文
摘要:
基于邻域的算法(2) 上一篇我们讲了基于用户的协同过滤算法,基本流程就是寻找与目标用户兴趣相似的用户,按照他们对物品喜好的对目标用户进行推荐,其中哪些相似用户的评分要带上目标用户与相似用户的相似度作为权重来计算。但是,基于用户的协同过滤算法存在一些弊端,如计算用户兴趣相似度矩阵将越来越困难,其运算时 阅读全文
摘要:
基于邻域的算法(1) 基于邻域的算法主要分为两类,一类是基于用户的协同过滤算法,另一类是基于物品的协同过滤算法。我们首先介绍基于用户的协同过滤算法。 基于用户的协同过滤算法(UserCF) 基于用户的协同过滤算法是最古老的算法了,它标志着推荐系统的诞生。当一个用户甲需要个性化推荐时,首先找到那些跟他 阅读全文
摘要:
推荐数据集MovieLens及评测 数据集简介 MoiveLens是GroupLens Research收集并发布的关于电影评分的数据集,规模也比较大,为了让我们的实验快速有效的进行,我们选取了发布于2003年2月的 MovieLens 1M,这个数据集包含6000个用户对4000个电影的一百万个评 阅读全文
摘要:
用户行为数据 很多事情用户无法表述自己喜欢什么,所以需要推荐算法挖掘用户行为数据,从用户行为中推测用户兴趣,从而给用户推荐他们感兴趣的物品。啤酒与纸尿布的故事就不讲了,相信大家也都听说过。用户行为数据在网站上最简单的存在形式就是日志。这些日志记录了用户的各种行为,如在电子商务网站中这些行为主要包括网 阅读全文
摘要:
评测指标 评测指标可以评测推荐系统各个方面的性能,有些是可以定量计算的,而有些只能定性描述。有些可以通过离线实验计算,有些需要通过用户调查获得,还有些只能在线评测。接下来我们将对各个评测指标进行介绍。 用户满意度 用户满意度无法进行离线计算,只能通过用户调查以及在线实验获得。如果是在线实验当中,可以 阅读全文