多模态融入推荐

最近刚好读了2篇文章，对于多模态特征处理的核心问题：

1，3都能取得一定效果，简单反而能有一定收益，多模态表征和序列表征毕竟还是差异比较大，简单输入能早点参与模型参数更新；2的话由于多模态表征深度参与，但由于多模态表征无法进行联合更新，效果一般

有啥更好的方式：

多模态特征的分布表示(target和seq)计算分箱分布统计
直接接入，但taget,seq向量直接接个DIN模型，这个辅助模型用来对齐多模态表征和序列模型表征；可以理解这个辅助模型在当前行为样本上的微调，然后把中间参数、logits和序列模型联合训练
simcore分数进行编码，通过一个可学习emb，学习数值型emb,然后和推荐系统进行联合训练

定义好<正、负>样本，对于文本<正样本取搜索文本和购买商品标题> <负样本取mini-batch随机负样本>；对应图片<正样本取搜索图片和购买商品图片> <负样本取mini-batch随机负样本>；正负样本的确定决定预训练多模态语义向量的质量
loss直接使用对比loss,infoNCE loss

(target,seq,pos,gap) 四元组；通过 Temporal Interest Module, TIM网络(说实话个人觉得这个网络效果不如显式的特征交叉，显式特征交叉表达信号强，交叉的浅训练充分，交叉阶数越大，训练越难，不容易收敛)

参考:

posted @ 2024-08-06 11:05 adam86546853 阅读(39) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 多场景多目标总结

· 对比学习在推荐中总结

2025年3月

日

一

二

三

四

五

六

adam86546853