推荐系统实践 - 第1章
1.互联网搜索及推荐发展
1)早期的孤岛式网站,门户网站出现,网站导航,属于针对网站的推荐。但是内容的获取还是需要到相应网站上去浏览。
2)搜索引擎:用户可以主动检索内容
3)推荐系统:主动的推荐用户感兴趣的物品,广告定向投放等。推荐系统发展:热销推荐->个性化推荐->捆绑式推荐。
netflix:研究的是预测用户看了电源后会给出怎样的评分。更有意义的应该是用户可能会喜欢的电源。
2.推荐系统评测指标
1)用户满意度:调查问卷或网站上收集
2)预测准确度:平方根误差(RMSE)、平均绝对误差(MAE)
3)召回率(recall)
4)准确率(precision)
5)覆盖率:如何发掘长尾商品。所有物品均有相等的机会出现在推荐列表中,出现的次数差不多,则该推荐系统覆盖率较高。通过流行度、基尼系数确定。推荐系统理论上应该尽量避免马太效应(强者更强,弱者更弱)。但是协同过滤算法等都有马太效应,某些卖家也可能有马太效应的需求。基尼系数评测是否有马太效应。
6)多样性:不在一棵树上吊死
7)新颖性:不要推荐哪些用户已经熟知,本来要购买的商品。计算推荐列表的平均流行度,愈不流行越有新意。多是长尾商品。
8)惊喜度:与新颖性有区别。惊喜度是用户本来不喜欢这个style,但是你推荐给了他,同时他看完之后又很满意。
9)信任度:提高推荐信任度的方式:增加透明度(比如:推荐解释),利用社交网络进行推荐。
10)实时性
11)健壮性:避免被攻击。BAB比VAV更有价值就是因为购买记录比访问记录更可信,更能避免注入攻击。
12)商业目标:理论与实际总是有差距,只有符合特定的商业目标才是好的推荐。
3.评测维度
用户维度、物品维度、时间维度。
4.评测方法
离线试验、用户调查、在线试验。