摘要:
最近一直在做多标签分类任务,学习了一种层次注意力模型,基本结构如下: 简单说,就是两层attention机制,一层基于词,一层基于句。 首先是词层面: 输入采用word2vec形成基本语料向量后,采用双向GRU抽特征: 一句话中的词对于当前分类的重要性不同,采用attention机制实现如下: te 阅读全文
摘要:
深度学习在推荐系统、CTR预估领域已经有了广泛应用,如wide&deep、deepFM模型等,今天介绍一下由阿里算法团队提出的深度兴趣网络DIN和DIEN两种模型 paper DIN:https://arxiv.org/abs/1706.06978 DIEN:https://arxiv.org/ab 阅读全文