随笔分类 - 推荐系统
摘要:https://mp.weixin.qq.com/s/czq70-4cDIhgEoJD5r-Qrg https://github.com/datawhalechina/fun-rec https://datawhalechina.github.io/fun-rec/#/ch01/ch1.2
阅读全文
摘要:https://www.infoq.cn/article/IzHTPNQ5zB-DFuPwTPBM
阅读全文
摘要:原文连接:https://mp.weixin.qq.com/s/06ZOgCaW7uWKT5OIMqHyGQ 导读:推荐系统在今天互联网产品和应用中起着举足轻重的地位。一般的推荐系统是基于云端计算中心到边缘 ( 比如手机、平板电脑等 ) 的结构,这其中会由于网络带宽和延迟等导致结果的延迟。边缘的实时
阅读全文
摘要:基于标签的推荐 58同城从0到1构建个性化推荐 阿里飞猪个性化推荐 推荐粗排(召回)工程实践之双塔DNN模型 向量表征和向量召回 推荐场景中召回模型的演化过程 用模型“想象”出来的target来训练,可以提高分类的效果(郭必扬) 历届腾讯广告算法大赛总结(方案+数据集) 推荐系统架构与算法流程详解
阅读全文
摘要:转自:https://zhuanlan.zhihu.com/p/104307718 背景 在推荐、搜索、广告等领域,CTR(click-through rate)预估是一项非常核心的技术,这里引用阿里妈妈资深算法专家朱小强大佬的一句话:“它(CTR预估)是镶嵌在互联网技术上的明珠”。 本篇文章主要是
阅读全文
摘要:常见的id类特征有用户特征user_id,物品特征item_id等,通常来说这类特征都是人为按顺序编码的特征,并不能反映用户或者物品的自然属性特征。但是在很多推荐相关的文章,都有提到使用这类特征,而且似乎还非常重要,并且除了推荐系统,在计算广告、反欺诈风控模型里都有成功的案例。这是为什么呢? 一、I
阅读全文
摘要:一、概述推荐系统 推荐系统的目标是给用户推荐喜欢或者需要的内容,做好推荐系统从宏观上看就是要做好如下三点: 深入理解用户,包括用户的基本属性,社会属性、行为属性等,从而知道用户喜欢什么,需要什么 对资源的刻画,将资源的信息充分挖掘提炼出来 选择适合业务场景的策略与模型,将用户和资源实现最佳匹配,这部
阅读全文
摘要:一、背景 推荐系统中,有一个刚需就是去重,去重主要涉及两块: 1)内容源去重,即有些抓取的文章基本是讲的一件事。 2)给用户推荐的内容去重,即不能重复推荐。 对于第一种去重,可以采用Google公布的去重算法Simhash,该算法适合海量数据去重。对于常规的文本相似度计算,需要分词,组合成一个向量,
阅读全文
摘要:一、应用场景 在基于用户兴趣召回物品时,每个用户都有兴趣标签,有时候可能兴趣标签非常多,每一个标签都有计算出来的权重,从高到底进行排序。在进行推荐的时候,我们到底基于哪些兴趣标签进行推荐呢,只选取topN的吗,还是全部?如果只选取topN的,那每次推荐结果都比较相似,而且权重低的兴趣标签似乎得不到推
阅读全文
摘要:排行榜其实就是热门榜,在推荐系统中非常重要,细细嚼来,其中也蕴藏了不少学问。究竟有什么作用呢? 一、排行榜的作用 1)解决新用户的冷启动问题,当新用户来的时候,我们没有他的任何信息,这个时候可以将热点资讯或者物品推荐给他。 2)发现老用户兴趣的方式。老用户兴趣比较明确了,在享受个性化推荐的同时,也可
阅读全文
摘要:如果想理解汤普森采样算法,就必须先熟悉了解贝塔分布。 一、Beta(贝塔)分布 Beta分布是一个定义在[0,1]区间上的连续概率分布族,它有两个正值参数,称为形状参数,一般用α和β表示,Beta分布的概率密度函数形式如下: 这里的Γ表示gamma函数。 Beta分布的均值是: 方差: Beta分布
阅读全文
摘要:一、定义 E&E就是探索(explore)和利用(exploit)。 Exploit:基于已知最好策略,开发利用已知具有较高回报的item(贪婪、短期回报),对于推荐来讲就是用户已经发现的兴趣,继续加以利用推荐。 优点:充分利用高回报item。 缺点:容易陷入局部最优,可能错过潜在最高回报的item
阅读全文
摘要:一、为什么需要推荐系统? 1)信息过载(information overload)问题日益严重 2)人找喜欢的物品、资讯变得越来越困难 3)新的产品想脱颖而出、得到关注,亦不容易 二、推荐系统主要能解决什么问题? 1)人与物的精确匹配,从人找信息,转变为信息找人2)帮助减少马太效应和长尾效应的影响
阅读全文