推荐系统学习笔记(二)

  1. 简介

个性化推荐算法都是机遇用户行为数据分析设计的

用户行为数据在网站上最简单的存在形式就是日志,网站会存储在文件系统中,每个绘画表示一次用户行为和对应服务。比如在搜索引擎和搜索广告系统中,服务会为每次查询生成一个战士日志,记录了查询和返回结果。如果用户点击了某个结果,点击信息会被服务器截获并存储在点击日志中

用户行为数据(ua)分类:

显性反馈行为,用户明确表态的行为,比如喜欢或者不喜欢,购买等动作

隐性反馈行为,不能明确反应用户喜好的行为,比如浏览

 

  1. 用户行为分析

在利用ua设计算法之前,需要分析数据规律

互联网上很多数据满足长尾分布f(x)=alpha*(x)^k

 

  1. 测评指标

召回率:描述有多少比例的用户-物品评分记录包含在最终的推荐列表里,

准确率:描述最终的推荐列表中有多少比例是发生过的用户-物品评分记录

覆盖率:最终的推荐列表中包含多大比例的物品

 

离线实验的性能在选择推荐算法时并不起决定作用,首先应该满足产品的需求

 

  1. 隐语义模型

核心思想是通过隐含特征联系用户兴趣和物品,LFM隐语义模型,最早在文本挖掘领域提出

 

  1. 基于邻域的算法

推荐系统中最基本的算法,包括协同过滤算法

UserCF和ItemCF算法

 

  1. 基于图的模型

用户行为很容易而粪土表示,因此很多图的算法都可以用到推荐系统

用户行为数据的二分图表示,基于图的模型是推荐系统中的重要内容

基于图的推荐算法:在二分图上给用户提供推荐,Personalrank算法通过随机游走,全图迭代造成时间复杂度很高

posted @ 2024-03-10 19:13  Heinrich♣  阅读(9)  评论(0编辑  收藏  举报