基于用户的协同过滤推荐算法实现原理及实现代码

基于用户的协同过滤推荐算法

基于用户的协同过滤推荐算法实现原理及实现代码
- 一、基于用户的协同过滤推荐算法实现原理
- 二、基于用户的协同过滤推荐算法实现代码

基于用户的协同过滤推荐算法实现原理及实现代码

一、基于用户的协同过滤推荐算法实现原理

传统的基于用户（User-Based）的协同过滤推荐算法实现原理分四个步骤：
1.根据用户历史行为信息构建用户-项目评分矩阵，用户历史行为信息包括项目评分、浏览历史、收藏历史、喜好标签等，本文以单一的项目评分为例，后期介绍其他行为信息和混合行为信息，用户-项目评分矩阵如表1所示：

	项目1	项目2	项目3
用户A	1	0	5
用户B	3	4	0
用户C	0	3	2

注：用户A对项目1的评分是1分，用户A对项目2没有评分。
2. 根据用户-项目评分矩阵计算用户之间的相似度。计算相似度常用的方法有余弦算法、修正余弦算法、皮尔森算法等等（后期我们会将相似度算法展开讲解，这里以余弦算法为例）。余弦算法公式如图1所示：
在这里插入图片描述
注：r_u表示用户u的评分集合（也就是矩阵中的一行评分数据），表示用户v的评分集合，i表示项目，表示用户u对项目1的评分乘以用户v对项目1的评分加上用户u对项目2的评分乘以用户v对项目2的评分……先相加再相乘直到最后一个项目，在这里插入图片描述表示用户u对项目1的评分的平方加上用户u对项目2的评分的平方加上……先平方再相加直到最后一个项目然后得到的值取平方根，平方根乘以用户v的平方根。
3. 根据用户之间的相似度得到目标用户的最近邻居KNN。KNN的筛选常用的有两种方式，一种是设置相似度阀值（给定一个相似度的下限，大于下限的相似度为最近邻居），一种是根据与目标用户相似度的高低来选择前N个最近邻居（本次以前N个为例，后期会详细对比讲解两者）。相似度排序可用经典冒泡排序法。
4. 预测项目评分并进行推荐。最常用的预测公式如图2所示：
在这里插入图片描述
注：该公式实际上是相似度和评分的加权平均数。表示用户u对项目i的预测评分，n是最近邻集合，v是任意一个最近邻居，表示最近邻v和目标用户u的相似度乘以最近邻v对项目i的评分。得到预测评分后按照评分高低进行降序推荐。
5. 结论。以上步骤是最简单，最传统的基于用户的协同过滤推荐算法的实现原理，但是在实现过程中还是有很多注意细节。

二、基于用户的协同过滤推荐算法实现代码

本文我们介绍两种实现代码，都是java语言开发，单机版（本地测试），数据集使用movielens的ml-100k，943*1682，80000条数据。
第一种，自定义实现：
1、项目目录，如图3所示：
在这里插入图片描述
2、运行结果

第二种，使用mahout api接口实现:
mahout是一个算法包，实现了很多协同过滤推荐算法接口，传统的基于用户的协同过滤推荐算法调用步骤很固定，运行结果如下：

附件：基于用户的协同过滤推荐算法实现代码java语言开发

posted @ 2019-11-09 10:12 linge511873822 阅读(157) 评论(0) 编辑收藏举报

刷新页面返回顶部

linge511873822

基于用户的协同过滤推荐算法实现原理及实现代码