随笔分类 - 推荐系统
摘要:https://blog.csdn.net/hellozhxy/article/details/103871580 推荐算法三视角:矩阵,图,时间线 讲了比较多的较前沿的知识, 比如swing,Adamic/Adar,图神经网络,deepwalk, node2vec,line,gcn,graphsa
阅读全文
摘要:https://easyai.tech/blog/gnn-deepwalk-graphsage/ 参考这篇文章 给定一个部分标记的 graph G,目标是利用这些标记的节点来预测未标记的节点的标签。它学习用包含邻域信息的 d 维向量 h_v 表示每个节点。即: 其中 x_co[v] 表示与 v 相连
阅读全文
摘要:https://github.com/CastellanZhang/alphaFM AlphaFM源码 再找DeepWalk的文章看一下 https://zhuanlan.zhihu.com/p/458843906 冷启动 https://zhuanlan.zhihu.com/p/48057256
阅读全文
摘要:参考这篇文章: https://blog.csdn.net/cxkyxx/article/details/108455805 我的理解:focal loss不是解决样本不平衡的问题,是解决hard/easy样本的问题。 平衡交叉熵 focal loss 样本平衡focal loss
阅读全文
摘要:https://zhuanlan.zhihu.com/p/166469248 双塔模型是应用非常普遍的深度学习召回模型,但是其本身也存在一些问题,比如使用softmax函数计算后验概率会带来采样偏差,popular item在负采样时出现的频率也会比较高等。 而Google2019年提出的双塔模型则
阅读全文
摘要:DSSM中的负样本为什么是随机采样得到的,而不用“曝光未点击”当负样本? 召回是将用户可能喜欢的item,和用户根本不感兴趣的海量item分离开来,他面临的数据环境相对于排序来说是鱼龙混杂的。 所以我们希望召回训练数据的正样本是user和item匹配度最高的那些样本,也即用户点击样本,负样本是use
阅读全文