摘要: 广告召回现状 现有的广告召回模型一般会分两步: 1. 首先用一个双塔模型去学习user embedding 和 ad embedding 2. 然后对于每个user embedding,用诸如HNSW、ball tree等方法召回相似向量 缺点:模型训练和向量召回是分离的,召回无法反馈到训练 Dee 阅读全文
posted @ 2021-07-29 15:24 xd_xumaomao 阅读(785) 评论(0) 推荐(0) 编辑
摘要: Jensen不等式 如果f是凸函数,X是随机变量,那么: 当且仅当X是常量时,该式取等号 凸函数: 设f是定义域为实数的函数,如果对所有的实数x,f(x)的二阶导数都大于0,那么f是凸函数 注:Jensen不等式应用于凹函数时,不等号方向反向。当且仅当x是常量时,该不等式取等号。 EM算法推导流程 阅读全文
posted @ 2021-07-29 11:47 xd_xumaomao 阅读(75) 评论(0) 推荐(0) 编辑
摘要: 背景 传统的cvr模型是在click样本上训练的,但是inference是在所有样本上做,这可能会导致样本选择偏差。(据我理解,这个样本上的偏差是不可能完全消除的,因为无论是ctr、cvr模型,都是在send之后的样本上训练的,但是inference的时候是不知道这个样本会不会被send的) 模型结 阅读全文
posted @ 2021-07-29 11:14 xd_xumaomao 阅读(176) 评论(0) 推荐(0) 编辑