06 2021 档案
摘要:1.Swing算法介绍 Swing算法原理比较简单,是阿里早期使用到的一种召回算法,在阿里多个业务被验证过非常有效的一种召回方式,它认为 user-item-user 的结构比 itemCF 的单边结构更稳定。 为了衡量物品ii和jj的相似性,考察都购买了物品ii和jj的用户uu和vv, 如果这两个
阅读全文
摘要:对于巨型互联网公司来说,为了控制数据规模,降低训练开销,降采样几乎是通用的手段,facebook 实践了两种降采样的方法,uniform subsampling 和 negative down sampling。 1、uniform subsampling uniform subsampling 是
阅读全文
摘要:1、参数个性化 CTR 模型 - PPNet 2019 年之前,快手 App 主要以双列的瀑布流玩法为主,用户同视频的交互与点击,观看双阶段来区分。在这种形式下, CTR 预估模型变得尤为关键,因为它将直接决定用户是否愿意点击展示给他们的视频。彼时业界主流的推荐模型还是以 DNN、DeepFM 等简
阅读全文
摘要:一、快手、抖音产品区别 1、用户群体 市面上流传着一句话“南抖音、北快手”,就是说玩抖音与玩快手的人群不同,说南方人喜欢玩抖音,北方人喜欢玩快手。这主要是与南北方习俗有直接联系,相对而言南方人喜欢安静,北方人喜欢热热闹闹的感觉,所以视频风格也有差异,虽然说现在抖音已经走向全球化,但是基本的用户群体还
阅读全文
摘要:1、推荐系统偏差概述 1. Selection Bias 选择偏差主要来自用户的显式反馈,如对物品的评分。由于用户倾向于对自己感兴趣的物品打分,很少对自己很少对自己不感兴趣的物品打分,造成了数据非随机缺失(Missing Not At Random, MNAR)问题,观察到的评分并不是所有评分的代表
阅读全文
摘要:1、推荐场景 快手主要的流量形态 有 4 个页面:在这些流量分发的场景中,推荐算法是起着核心主导作用,直接决定了用户的体验。 ① 发现页:致力于让用户看见更大的世界,分为单列和双列两种形态。 双列 点选模式,给用户提供选择的自由 单列 上下滑浏览,给用户沉浸式的浏览体验 ② 关注页:一个半熟人半陌生
阅读全文
摘要:问题:如果分布P和Q,KL(P||Q)很大而KL(Q||P)很小表示什么现象? 还是看定义吧。直观来说,这是对随机变量的每个取值上,这个值的加权平均。这里加权的权值是 (其实就是算了个期望)。 在大的地方,想让KL散度小,我们需要让的值尽量也大;而当本身小的时候,对整个KL的影响却没有那么大(因为l
阅读全文