ctr模型演变

 CTR任务的特点:

大量离散特征
大量高维度稀疏特征
特征工程:特征组合对于效果非常关键

 

传统ctr预估方法:

基础版:线性模型LR

 

改进版:加入特征组合

FM模型: 训练特征向量,提高模型泛化能力

 

 GBDT模型:输出多维特征

LR+GBDT

 GBDT+FM模型

集成GBDT和FM各自的优势
• GBDT发现最有效的组合特征Feature Set
• 将Feature Set引入FM模型中

 

深度学习:

图片处理: CNN

自然语言处理: 双向RNN+attention

 

深度学习CTR模型要解决的几个关键问题
CTR任务特点:大量离散特征的表示问题

CTR任务特点:如何快速处理大量高维度稀疏特征?(OneHot 2 Dense)
特征工程:如何从手工到自动?(深度学习的优势)

特征工程:如何捕获和表达两两组合特征?(FM机制神经网络化)

特征工程:如何捕获和表达多组组合特征?(利用Deep网络)

特征:

连续特征

离散特征

离散特征如何让DNN可以处理

解决思路:从OneHot到Dense Vector

 

 

 

 

引入低阶特征

高阶特征与低阶特征融合

 

posted @ 2018-04-17 22:37  xmeo  阅读(1824)  评论(0编辑  收藏  举报