论文阅读 - Item-to-Item Collaborative Filtering

本文是我在阅读 Amazon 工程师 2003 年发表的论文 Item-to-Item Collaborative Filtering 时记录的笔记。

介绍

Amazon.com 的推荐系统所面对的挑战：

海量商品+海量用户
实时推荐，半秒内做出响应，且生成可靠的推荐结果
新用户的信息很少，老用户有大量的信息
用户的信息是易变的，用户在短时间内产生的交互信息，就能改变用户的特征，推荐系统需要快速地对用户特征的改变做出反应。

传统的 CF 算法，不能满足实时性要求，这里提出 item-to-item collaborative filtering 算法，它的计算量独立于用户数量和商品数量，可以在海量数据的场景下，实时地产生高质量的推荐。

Item-to-Item Collaborative Filtering

item-to-item CF 寻找与用户购买过的物品相似的其他物品，组合这些相似物品，得到最终的推荐结果。

Rather than matching the user to similar customers, item-to-item collaborative filtering matches each of the user’s purchased and rated items to similar items, then combines those similar items into a recommendation list.

算法细节

这里提出的算法依然需要计算 item 间的相似度，只不过 Amazon 的这篇论文提出了一种计算 item 间相似度的策略。

从某个用户同时购买过的多个 item 间开启计算，而不是拿某个 item 和其他所有 item 进行计算。因为很多 item 之间并没有某个人都购买过，这两个 item 间的相似度是没法算的。通过上面给出的算法，可以减少计算量。

计算完成之后，每个 item 都被关联了 k 个相似的物品。

可扩展性

item-to-item collaborative filtering 能够应对大量数据场景，因为 item 之间的相似度具有持久性，可以预先离线进行计算。

总结

通过阅读论文，我感觉 collaborative filtering 在早期（2000年左右），专指 user-based CF，即通过找相似用户，用相似用户喜欢的物品作为推荐结果的方法。后来慢慢引入了 item-based（如本文所描述），然后才将 CF 算法分为 user-based 和 item-based。

本文就讲了 item-based 的具体做法，关于相似度计算等方法，就和 user-based CF 一样，所以没有再提。另外 item 之间计算相似度的策略（即前面伪代码所描述）也值得学习。

posted @ 2019-09-17 16:07 wy-ei 阅读(1330) 评论(0) 收藏举报

刷新页面返回顶部

WY's Notes

stay hungry, stay foolish.

论文阅读 - Item-to-Item Collaborative Filtering

介绍

推荐算法

传统的协同过滤

Cluster Models

Search-Based Methods

Item-to-Item Collaborative Filtering

算法细节

可扩展性

总结

公告