深度学习推荐系统
问题
页码 | 问题内容 |
---|---|
P46 | 为什么L1范数比L2范数更容易产生稀疏解 |
前深度学习时代
P48
模型名称 | 基本原理&Tips | 特点 | 局限性 |
---|---|---|---|
协同过滤(Collaborative, CF) | 协同大家的反馈、评价和意见(共现矩阵)一起对海量的信息进行过滤,focus相似度 | 非常直观 | 但泛化性很差,无法将两个物品相似这一信息用于计算—新商品的向量非常稀疏,推荐结果的头部效应很明显 |
用户协同过滤 UserCF | 具有较强的社交特性,适合发现热点,跟踪热点的趋势————适合新闻推荐场景 | 互联网应用下用户数远远大于物品数,用户的历史数据向量往往非常稀疏 | |
物品协同过滤 ItemCF | 适用于兴趣变化较为稳定的应用,比如电商,视频推荐场景 | ||
改进算法—矩阵分解 | 为每个用户和视频生成一个隐向量,在空间上相近的用户和视频即为类似视频。计算方法:特征值分解(只能方阵),奇异值分解(要求稠密,计算量大),梯度下降 | 提高了稀疏矩阵的处理能力,泛化能力强,空间复杂低,扩展性 | 难以利用其他用户、物品特征以及上下文信息 |
逻辑回归 | 点击率(Click Through Rate, CTR)预估问题,focus分类问题,预测正样本的概率 | 表达能力不强,无法特征交叉,特征筛选等一系列高级操作,不可避免的造成信息损失。 | |
因子分解机(Factorization Machine, FM) | |||
域感知因子分解机(Field-aware Factorization Machine, FFM) | |||