-
简介
个性化推荐算法都是机遇用户行为数据分析设计的
用户行为数据在网站上最简单的存在形式就是日志,网站会存储在文件系统中,每个绘画表示一次用户行为和对应服务。比如在搜索引擎和搜索广告系统中,服务会为每次查询生成一个战士日志,记录了查询和返回结果。如果用户点击了某个结果,点击信息会被服务器截获并存储在点击日志中
用户行为数据(ua)分类:
显性反馈行为,用户明确表态的行为,比如喜欢或者不喜欢,购买等动作
隐性反馈行为,不能明确反应用户喜好的行为,比如浏览
-
用户行为分析
在利用ua设计算法之前,需要分析数据规律
互联网上很多数据满足长尾分布f(x)=alpha*(x)^k
-
测评指标
召回率:描述有多少比例的用户-物品评分记录包含在最终的推荐列表里,
准确率:描述最终的推荐列表中有多少比例是发生过的用户-物品评分记录
覆盖率:最终的推荐列表中包含多大比例的物品
离线实验的性能在选择推荐算法时并不起决定作用,首先应该满足产品的需求
-
隐语义模型
核心思想是通过隐含特征联系用户兴趣和物品,LFM隐语义模型,最早在文本挖掘领域提出
-
基于邻域的算法
推荐系统中最基本的算法,包括协同过滤算法
UserCF和ItemCF算法
-
基于图的模型
用户行为很容易而粪土表示,因此很多图的算法都可以用到推荐系统
用户行为数据的二分图表示,基于图的模型是推荐系统中的重要内容
基于图的推荐算法:在二分图上给用户提供推荐,Personalrank算法通过随机游走,全图迭代造成时间复杂度很高