上一页 1 2 3 4 5 6 7 ··· 37 下一页
摘要: https://zhuanlan.zhihu.com/p/266023273 阅读全文
posted @ 2024-05-11 16:39 xd_xumaomao 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 论文链接:Deep Match to Rank Model for Personalized Click-Through Rate Prediction 代码链接 背景 目前推荐系统大多集中在研究怎么建模用户的个性化推荐,对user和item相关性的研究比较少,这篇论文结合match和rank阶段的 阅读全文
posted @ 2024-04-29 20:31 xd_xumaomao 阅读(40) 评论(0) 推荐(0) 编辑
摘要: from pyspark.sql import SparkSession spark = SparkSession.builder.enableHiveSupport().getOrCreate() spark.conf.set("hive.exec.dynamic.partition.mode", 阅读全文
posted @ 2024-04-01 09:47 xd_xumaomao 阅读(26) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/m0_37924639/article/details/112503883 https://zhuanlan.zhihu.com/p/261923201 阅读全文
posted @ 2024-03-19 17:23 xd_xumaomao 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 背景 MMoE模型从一定程度上解决了多个目标(任务)在训练过程中的相互耦合的问题,即使用门控概念(gate network)降低了因为share-layer部分带来的“特征耦合”。但其实这是不够的,因为在每一个expert内部,与其他的expert不存在联系,这导致每个expert的表达能力不是“那 阅读全文
posted @ 2024-03-06 11:35 xd_xumaomao 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 1. MSE(均方误差损失) 优点: 1. 收敛快 缺点: 1. 假设了样本服从正态分布,如果训练样本label不服从正态分布,则MSE并非最大似然估计 2. 对异常点很敏感 2. MAE(平均绝对误差损失) 优点:不容易受异常值影响 缺点:收敛速度慢,拟合能力弱 3. Huber Loss 结合了 阅读全文
posted @ 2024-02-20 13:12 xd_xumaomao 阅读(704) 评论(0) 推荐(0) 编辑
摘要: 双塔模型介绍 由于粗排的候选数目比精排多很多,粗排无法做的和精排一样复杂。现在业内比较通用的方案是采用双塔模型,左边塔建模user embedding,右边塔建模item embedding,由于用户的行为经常发生变化,user tower需要经常更新,但是item状态很少发生变化,可以离线算好所有 阅读全文
posted @ 2024-02-18 12:03 xd_xumaomao 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 张俊林:从对比学习视角,重新审视推荐系统的召回粗排模型 小红书高时效推荐系统背后的技术升级 https://github.com/Doragd/Algorithm-Practice-in-Industry 1.9万亿参数量,快手落地业界首个万亿参数推荐精排模型 推荐系统融合排序的多目标寻优技术 ht 阅读全文
posted @ 2024-02-04 11:48 xd_xumaomao 阅读(25) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/608636233 待整理 阅读全文
posted @ 2024-02-04 11:39 xd_xumaomao 阅读(114) 评论(0) 推荐(0) 编辑
摘要: https://zhuanlan.zhihu.com/p/560657191 待整理 阅读全文
posted @ 2024-02-04 11:34 xd_xumaomao 阅读(72) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 ··· 37 下一页