随笔分类 - 推荐系统
摘要:假设通过用户 - 物品相似度进行个性化推荐 用户和物品的 Embedding 都在一个 \(k\) 维的 Embedding 空间中,物品总数为 \(n\),计算一个用户和所有物品向量相似度的时间复杂度是$ O(k*n)$ 直觉的解决方案 基于聚类 基于索引 基于聚类的思想 优点: 离线计算好每个
阅读全文
摘要:模型召回之SimCSE dataset unsuper import numpy as np import math class UnsuperviseData(tf.keras.utils.Sequence): def __init__(self, x_set, batch_size): self
阅读全文
摘要:模型召回之DSSM 双塔模型 负样本构造:训练前构造或训练时批内构造 实现 model from transformers import AutoConfig,AutoTokenizer,TFAutoModel MODEL_NAME = "hfl/chinese-roberta-wwm-ext" t
阅读全文
摘要:方案: https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/neural_search 模型召回:双塔模型 DSSM、sentence-bert、simcse 向量检索利器:ANN [1] 最近邻搜索 (Neares
阅读全文
摘要:技术架构 整体可以分为 检索召回、排序 搜索相关的策略大体分为如下: query 理解->分词,纠错,意图识别,term weight 等 召回-> bool检索,倒排索引, bm25, tf-idf, 语义相似度 等 排序-> learning to ranking,深度模型 等 尽快划分为不同阶
阅读全文
摘要:知识图谱作为认知智能的重要一环,知识赋能的智能推荐将成为未来推荐的主流。智能推荐表现在多个方面,包括场景化推荐、任务型推荐、冷启动场景下推荐、跨领域推荐、知识型推荐[1] 1)场景化推荐 比如用户在淘宝上搜“沙滩裤”、“沙滩鞋”,可以推测这个用户很有可能要去沙滩度假。那么平台是否能推荐“泳衣”、“防
阅读全文
摘要:本文将介绍Alibaba发表在KDD’19 的论文《Practice on Long Sequential User Behavior Modeling for Click Through Rate Prediction》。文章针对长序列用户行为建模的问题从线上系统和算法两方面进行改进,已经成功部署
阅读全文
摘要:本文将介绍Google发表在RecSys’19 的论文《Recommending What Video to Watch Next: A Multitask Ranking System》。主要解决大规模视频推荐中的排序阶段的多任务学习和用户选偏置问题。 背景 给定当前用户正在观看的视频,推荐给用户
阅读全文
摘要:本文将介绍阿里发表在 SIGIR’18 的论文ESMM《Entire Space Multi Task Model: An Effective Approach for Estimating Post Click Conversion Rate》。文章提出使用多任务学习解决CVR(转化率)预估时的 样
阅读全文
摘要:推荐中的个性化重排 Personalized Re ranking for Recommendation 这篇文章是阿里在ResSys'19发表的,主要贡献是在重排序阶段,引入了用户的相关信息,很符合实际场景。 PRM的提出 重排主要是对排序后结果的优化,也可以用于二次推荐。考虑到性能原因,典型的排
阅读全文
摘要:看看阿里如何在淘宝做推荐,实现“一人千物千面”的用户多样化兴趣推荐,首先总结下DIN、DIEN、DSIN: 传统深度学习在推荐就是稀疏到embedding编码,变成稠密向量,喂给NN DIN引入attention机制,捕获候选商品和用户浏览过的商品之间的关系(兴趣) DIEN在DIN基础上引入序列概
阅读全文
摘要:Learning to Rank pointwise $$ L\left(f ; x_{j}, y_{j}\right)=\left(y_{j} f\left(x_{j}\right)\right)^{2} $$ 只考虑给定查询下单个文档的绝对相关度,不考虑其他文档和给定查询的相关度. 输入空间中样
阅读全文
摘要:推荐系统模型演化 LR-->GBDT+LR FM-->FFM-->GBDT+FM|FFM FTRL-->GBDT+FTRL Wide&DeepModel (Deep learning era) 将从以下3方面进行模型分析: 1.why(模型设计背后的原理) 2.how(具体怎么设计,如何应用) 3.
阅读全文