摘要: 1.发掘用户兴趣1)啤酒和尿布的故事2)用户行为数据:session log、impression log、click log。这些日志记录了用户的行为:浏览、购买、点击、评分、评论3)用户行为:显性反馈行为、隐性反馈行为2.用户行为分析1)长尾分布:发f(x)=ax^k2)协同过滤算法:仅仅基于用户行为数据设计的推荐算法。包含:基于邻域(基于用户的协同过滤算法userCF、基于物品的协同过滤算法itemCF)、隐语义模型、基于图的随机游走算法。3)userCF:给用户推荐和他兴趣相似的其他用户喜欢的物品。计算用户的相似度。Digg在应用,相比较MostPopular算法,准确率和召回率都要高 阅读全文
posted @ 2014-03-21 18:17 Django's blog 阅读(649) 评论(0) 推荐(0) 编辑
摘要: 1.互联网搜索及推荐发展1)早期的孤岛式网站,门户网站出现,网站导航,属于针对网站的推荐。但是内容的获取还是需要到相应网站上去浏览。2)搜索引擎:用户可以主动检索内容3)推荐系统:主动的推荐用户感兴趣的物品,广告定向投放等。推荐系统发展:热销推荐->个性化推荐->捆绑式推荐。netflix:研究的是预测用户看了电源后会给出怎样的评分。更有意义的应该是用户可能会喜欢的电源。2.推荐系统评测指标1)用户满意度:调查问卷或网站上收集2)预测准确度:平方根误差(RMSE)、平均绝对误差(MAE)3)召回率(recall)4)准确率(precision)5)覆盖率:如何发掘长尾商品。所有物品 阅读全文
posted @ 2014-03-21 15:48 Django's blog 阅读(520) 评论(0) 推荐(0) 编辑