Recurrent Meta-Learning against Generalized Cold-Start Problem in CTR Prediction阅读笔记
动机
本文是ACM MM2022上的一篇论文。在冷启动问题中,之前的工作大多数只考虑到新用户和新广告,并且用户的兴趣也可能随着时间去改变。因此,本文作者认为冷启动问题在时间维度上也存在,提出了广义的冷启动,并且提出了解决广义上的冷启动问题的方法。
方法
本文对冷启动的定义将一个会话序列(短的交互序列)定义为一个任务,而不是像往常一样将一个用户当作一个任务。每个用户可以将自己的交互序列切分为多个会话序列,每个会话序列最后一个物品当作预测目标的物品。
本方法框架如下
首先将用户、序列、目标输入进embedding层以获得embedding表示,
然后通过attention层根据目标和序列物品计算出权重,加权获得序列表示,
再通过lstm层获取序列的另一种表示,
lstm层可以提取用户的兴趣转移,attention可以捕获序列和目标物品的相关性,两者搭配使用可以减少噪声影响。
将上述表示连接起来,然后输入进MLP获取最终预测
预测损失为
辅助损失为
所有的损失为
训练方法采用MAML。
实验结果
本论文提出的方法超越所有的baseline。
总结
本文是会话推荐冷启动,和之前冷启动问题的定义不同,主要是利用了lstm和transformer捕获了更多的序列信息,再加上元学习,可以让包含新用户和新物品的会话序列快速适应推荐系统。