阿里transformer序列建模论文BST
这篇论文和DIN最大区别就是把target-attention部分替换成了transformer encoder结构,相对于DIN的优点是DIN只考虑了target-item和序列litem之间的相似性,而transformer对序列内部的关系进行了建模
整体的模型结构如下图所示:
这篇论文和DIN最大区别就是把target-attention部分替换成了transformer encoder结构,相对于DIN的优点是DIN只考虑了target-item和序列litem之间的相似性,而transformer对序列内部的关系进行了建模
整体的模型结构如下图所示: