随笔分类 - 推荐系统
摘要:1 引言 众所周知: 召回阶段需要尽可能覆盖用户感兴趣的各种类型物品; 粗排模型要求计算快, 精排模型要求计算准确, 重排考虑业务规则、多样性等。 在粗排用的最广泛的就是DSSM双塔模型,其会将用户特征、广告特征分别用两个shallow-dnn的结构计算,得到embedding,线上serving时
阅读全文
摘要:整理下一些常用的评估模型的指标 1 AUC AUC(Area Under Curve)被定义为ROC曲线下与坐标轴围成的面积,显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。AUC越接近1.0,检测方法真实性越高;等于0.5时,则真
阅读全文
摘要:【A】 Ad Exchanges 广告交易系统,为广告主,为媒体提供交易的一个平台,保证每个广告位的价值最大化。 Ad Network ADN可以被理解为媒体代理公司,通过为广告主采购媒体方流量,赚取中间差价,其代表有百度网盟等 ADimp (ADimpression): 单个广告的展示次数 ADP
阅读全文
摘要:1 什么是粗排 粗排英文叫pre-ranking,即在排序之前的部分,主要是通过召回获取了足够多的候选物料集,这时候虽然可以一股脑的全堆给后面的排序,但是假如候选集过大,排序模型过于复杂,那么排序阶段会耗时过长;这时候可以增加一个粗排,用来做进一步的筛选,将数据量进一步降下去。 粗排的进展还是较慢的
阅读全文
摘要:1 引言 DSSM,业内也叫做双塔模型,2013年微软发出来是为了解决NLP领域中计算语义相似度任务,即如何让搜索引擎在大规模web文件中基于query给出最相似的docment。因为语义匹配本身是一种排序问题,和推荐场景不谋而合,所以 DSSM 模型被自然的引入到推荐领域中。因为效果不错并且对工业
阅读全文
摘要:引言 youtube作为全球最大的视频内容网站,无时无刻都上传成百上千的事情,目前应该也有千亿个视频了,2016年,youtube决定接着用DL做点事情,之前都是基于MF,或者协同过滤做事情。2016年的时候,全球还很少将DL应用在推荐领域,youtubeDNN也是十分经典的召回和排序模型. 上图就
阅读全文
摘要:引言 其实最开始推荐系统根本就没召回,直接基于物料池进行排序就行,但是如果物料池变得超大,为了技术和业务发展,每个样本的特征越来越复杂,如果直接精排是没法工程的,所以增加召回,即用更简单的模型更少的特征或者直接规则对候选集快速筛选,减少排序阶段的耗时;同时召回的加入也能让业务更加丰富,如想对这个人增
阅读全文
摘要:引言 推荐系统中的推荐是建立在海量数据挖掘基础上的,主要是给用户提供个性化的信息服务和决策支持,其主要作用是: 降低信息过载 发掘长尾 提高转化率 按照现在说法,推荐系统其实就是人,货,场中的场。主要就是将不同的信息推荐给不同的人,分为: 个性化,千人千面,精准到个人一面 非个性化,如热门推荐,编辑
阅读全文
摘要:引言 din是阿里妈妈17年的论文,其中在之前embedding&mlp基础上增加了attention,主要思想是:embedding&mlp结构中,并未考虑到用户历史商品的针对性,举个例子: 用户a历史商品中主要都是衣服; 用户b历史商品中主要都是电子书 可以得出,用户a,如果给他呈现的推荐商品是
阅读全文