12 2020 档案

摘要:做过深度学习的小伙伴,大家应该多多少少都听说过Embedding,这么火的Embedding到底是什么呢?这篇文章就用来介绍Embedding。另外,基于深度学习的推荐系统方法或者论文还没有结束,我打算穿插进行讲解,毕竟,深度学习出来的推荐框架的算法实在是太相像了,很难有大的不同。所以,这一篇就聊聊 阅读全文
posted @ 2020-12-21 21:44 NoMornings 阅读(467) 评论(0) 推荐(0) 编辑
摘要:前言 这一篇文章我们来谈一下2017年新加坡国立大学提出的基于深度学习的协同过滤模型NeuralCF。我们在之前讲过矩阵分解技术,将协同过滤中的共现矩阵分解成用户向量矩阵以及物品向量矩阵。那么Embedding的思路也是一样的,只不过不是通过矩阵分解的形式,而是通过多层神经网络使用Embedding 阅读全文
posted @ 2020-12-18 17:19 NoMornings 阅读(589) 评论(2) 推荐(0) 编辑
摘要:这一篇,我们将介绍微软BING AD团队提出的Deep Crossing模型,用来解决大规模特征组合问题的模型,这些特征可以是稠密的,也可以是稀疏的,从而避免了人工进行特征组合,并使用了当年提出的残差神经网络。这个模型也算是深度学习在推荐系统的完整应用了:完整的解决了特征工程、稀疏向量稠密化、多层神 阅读全文
posted @ 2020-12-17 15:33 NoMornings 阅读(365) 评论(0) 推荐(1) 编辑
摘要:从这一篇开始,我们开始学习深度学习推荐模型,与传统的机器学习相比,深度学习模型的表达能力更强,并且更能够挖掘出数据中潜藏的模式。另外。深度学习模型结构也非常灵活,能够根据业务场景和数据结构进行调整。还是原来的样子,我会按照原理以及代码实现,再就是一些优缺点进行逐一介绍。 AutoRec AutoRe 阅读全文
posted @ 2020-12-14 20:00 NoMornings 阅读(506) 评论(0) 推荐(0) 编辑
摘要:在之前介绍的几个模型中,存在这些问题: LR不能捕捉非线性,只能进行一次的回归预测 GBDT+LR虽然能够产生非线性特征组合,但是树模型不适用于超高维稀疏数据 FM利用二阶信息来产生变量之间的相关性,但是无法适应高阶组合特征,高阶组合容易爆炸 那么,下面介绍的LS-PLM模型一定程度上缓解了这个问题 阅读全文
posted @ 2020-12-10 19:27 NoMornings 阅读(852) 评论(0) 推荐(2) 编辑
摘要:前一篇文章我们介绍了LR->FM->FFM的整个演化过程,我们也知道,效果最好的FFM,它的计算复杂度已经达到了令人发指的n2k。其实就是这样,希望提高特征交叉的维度来弥补稀疏特征,不可避免的带来组合爆炸和计算复杂度过高的问题。这一篇,我们介绍一下Facebook提出的GBDT+LR的组合来解 阅读全文
posted @ 2020-12-09 19:12 NoMornings 阅读(258) 评论(0) 推荐(1) 编辑
摘要:逻辑回归(LR) 在介绍FM系列之前,我想首先简单介绍一下逻辑回归。通常来说,逻辑回归模型能够综合利用更多的信息,如用户、物品、上下文等多种不同的特征,生成更为全面的结果。另外,逻辑回归将推荐问题看成一个分类问题。通过预测正样本的概率对物品进行排序,这里的正样本可以是用户观看了某个视频,也可以是用户 阅读全文
posted @ 2020-12-07 19:16 NoMornings 阅读(618) 评论(0) 推荐(0) 编辑
摘要:前言 推荐系统实践那本书基本上就更新到上一篇了,之后的内容会把各个算法结合着《深度学习推荐算法》这本书拿来当专题进行讲解。在这一篇,我们将会介绍矩阵分解这一方法。一般来说,协同过滤算法(基于用户、基于物品)会有一个比较严重的问题,那就是头部效应。热门的物品容易跟大量的物品产生相似性,而尾部的物品由于 阅读全文
posted @ 2020-12-04 20:43 NoMornings 阅读(391) 评论(0) 推荐(0) 编辑
摘要:什么是冷启动问题 如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。冷启动问题主要分为三类: 用户冷启动 物品冷启动 系统冷启动 下面我们将分别介绍这三种冷启动情况。 用户冷启动 用户冷启动主要解决如何给新用户做个性化推荐的问题。当新用户到 阅读全文
posted @ 2020-12-02 20:19 NoMornings 阅读(296) 评论(0) 推荐(0) 编辑
摘要:用户行为数据的二分图表示 用户的购买行为很容易可以用二分图(二部图)来表示。并且利用图的算法进行推荐。基于邻域的模型也可以成为基于图的模型,因为基于邻域的模型都是基于图的模型的简单情况。我们可以用二元组(u,i)来表示用户u对物品i有过购买行为,这样的话数据集可以用一个二分图来表示。我这 阅读全文
posted @ 2020-12-01 17:19 NoMornings 阅读(470) 评论(0) 推荐(1) 编辑

喜欢请打赏

扫描二维码打赏

支付宝打赏

点击右上角即可分享
微信分享提示