摘要: 一、背景 推荐系统中,有一个刚需就是去重,去重主要涉及两块: 1)内容源去重,即有些抓取的文章基本是讲的一件事。 2)给用户推荐的内容去重,即不能重复推荐。 对于第一种去重,可以采用Google公布的去重算法Simhash,该算法适合海量数据去重。对于常规的文本相似度计算,需要分词,组合成一个向量, 阅读全文
posted @ 2019-07-23 15:41 光彩照人 阅读(3572) 评论(0) 推荐(0) 编辑
摘要: 一、应用场景 在基于用户兴趣召回物品时,每个用户都有兴趣标签,有时候可能兴趣标签非常多,每一个标签都有计算出来的权重,从高到底进行排序。在进行推荐的时候,我们到底基于哪些兴趣标签进行推荐呢,只选取topN的吗,还是全部?如果只选取topN的,那每次推荐结果都比较相似,而且权重低的兴趣标签似乎得不到推 阅读全文
posted @ 2019-07-23 11:32 光彩照人 阅读(2980) 评论(0) 推荐(0) 编辑
摘要: 排行榜其实就是热门榜,在推荐系统中非常重要,细细嚼来,其中也蕴藏了不少学问。究竟有什么作用呢? 一、排行榜的作用 1)解决新用户的冷启动问题,当新用户来的时候,我们没有他的任何信息,这个时候可以将热点资讯或者物品推荐给他。 2)发现老用户兴趣的方式。老用户兴趣比较明确了,在享受个性化推荐的同时,也可 阅读全文
posted @ 2019-07-23 10:00 光彩照人 阅读(963) 评论(0) 推荐(0) 编辑