推荐算法的知识框架【更新中】
几年前刚进入行业时,就简单认为不过是wide&deep做精排,双塔FM做召回做粗排,再加上一些周边项目,比如冷启动和多模型融合调参,就组成了一个完整的推荐系统算法部分。再回头思考这一切,不再迷失在各式各样的实现细节中,关注本质,有了更广泛的认识,分为一下几个部分。
1. 建模方法
多阶段的推荐系统如何建模,召回/粗排建模精排还是最终的目标,有效的模型是定义明确的对象,不能说以dau为目标做建模
1.1 pairwise
1.2 learn to rank ? listwise
2. 特征和样本
2.1
2. 模型
2.1 模型结构
-
LR
-
FM
新的认识,数学上的,items x users 的 01矩阵 A(m*n) ,m 个item, n个user,m和n都很大,压缩成 m * d 和 d * n 维向量,看作是近似矩阵分解
FFM
Wide&deep
DeepFM
xDeepFM
SENet
召回模型
向量化,简单有效,FM真是一把利器
但是压缩成向量限制了性能,更多的手段
粗排模型
从双塔到小精排
2.2 优化器
2.3 超参数
几个最重要的超参数,learning rate,batch size,parallel size,
初始化方法,
正则化,