01 2024 档案
摘要:背景 利用BERT来做推荐 模型结构 模型训练
阅读全文
摘要:待补充 https://zhuanlan.zhihu.com/p/94177908/
阅读全文
摘要:背景 作者通过观察发现,用户的行为序列由多个session组成,session是根据时间划分出来的用户行为(比如说可以根据用户浏览时间划分session,若用户30分钟没有浏览记录时,下一次浏览即为一个新的session),观察发现每个session内部用户行为是高度相似(同质)的,不同sessio
阅读全文
摘要:背景 DIEN 通过引入GRU结构来建模用户的兴趣进化趋势 方法 整体结构 DIEN和常用模型的差异点在序列建模的部分,该部分结构由兴趣提取层和兴趣进化层两个部分组成: 兴趣提取层:从用户的行为序列中提取用户的兴趣序列 兴趣进化层:建模和target item相关的兴趣进化过程 兴趣提取层 兴趣进化
阅读全文
摘要:这篇论文和DIN最大区别就是把target-attention部分替换成了transformer encoder结构,相对于DIN的优点是DIN只考虑了target-item和序列litem之间的相似性,而transformer对序列内部的关系进行了建模 整体的模型结构如下图所示:
阅读全文
摘要:背景 用户是否点击一个物品可能受长期兴趣和短期行为的影响,用户的长期兴趣一般比较稳定,短期兴趣会不断变化。现有的工作中对长期兴趣和短期兴趣的建模师混合在一起的,这片论文提出了一种对长期兴趣和短期兴趣分开建模的方法。 方法 用户兴趣建模 U:用户属性,包含了用户ID和行为序列 Ul:用户的长期兴趣表示
阅读全文
摘要:背景 这是阿里2019年发表的一篇用于召回阶段的序列建模论文,这篇论文主要解决了两个问题: 1. 用户可能有多个兴趣(这篇论文的多个兴趣是指用户是否购买一个商品可能会受颜色、品牌、店铺等多个因素影响),如何建模多个兴趣 2. 用户的兴趣可以分为短期兴趣(当前session),长期兴趣,如何同时建模长
阅读全文
摘要:训练:对label分桶 serving:落在每个桶的概率*桶均值
阅读全文
摘要:https://zhuanlan.zhihu.com/p/532850353 https://zhuanlan.zhihu.com/p/554735911
阅读全文
摘要:背景 现有的工作只把用户表示成一个向量,但一个用户兴趣向量很难捕获用户多方面的兴趣,MIND是阿里提出的用于召回阶段的多兴趣建模论文,这篇论文把用户表示成了多个兴趣向量 方法 MIND的模型结构如下图所示,和常用的召回模型一样,先把每个用户表示成向量: 其中 Iu是用户的行为序列,Pu是用户属性特征
阅读全文
摘要:背景 通过学习句子的向量表示达到语义搜索、文本相似度计算 方法 正样本:相邻片段 负样本:inbatch其它样本 参考资料 https://zhuanlan.zhihu.com/p/496870495 https://zhuanlan.zhihu.com/p/469474178
阅读全文
摘要:https://zhuanlan.zhihu.com/p/148416488?utm_id=0 https://zhuanlan.zhihu.com/p/154401513
阅读全文
摘要:https://zhuanlan.zhihu.com/p/415610118 https://mp.weixin.qq.com/s/gsI-LqaH_uHN0qJH98sS4A
阅读全文
摘要:生成模型如何生成样本 我们现在有一些样本(如图片),想生成更多的样本(图片),应该怎么做呢?最直接的想法是去学习样本的分布 p(X) ,从这个分布 p(X) 采样就可以了,但是真实的样本分布往往是九曲回肠的,很难通过有限的样本直接学出来 那么可以换个思路,不直接学习分布,而是学习分布的映射,即训练一
阅读全文
摘要:https://kexue.fm/archives/4439/comment-page-2
阅读全文