2022 年 6月随笔档案 - 今夜无风

推荐系统-如何理解特征交叉

摘要：目标是在数据稀疏的情况下，用模型来做特征交叉。（特征交叉可以发掘特征之间的关联性）目标解读：我们假设一个场景：数据包含用户id，性别，年龄，地区特征来预测对口红的点击率。如果性别为女而且年轻，那么他对口红的点击率应该高，这说明性别和年龄有关联，需要在多项式后，加一项（系数a*x1*x2），这就是特阅读全文

posted @ 2022-06-27 22:03 今夜无风阅读(117) 评论(0) 推荐(0) 编辑

MMoE核心代码

摘要：class MMoE_Layer(tf.keras.layers.Layer): def __init__(self,expert_dim,n_expert,n_task): super(MMoE_Layer, self).__init__() self.n_task = n_task # 专家个数阅读全文

posted @ 2022-06-27 20:11 今夜无风阅读(340) 评论(0) 推荐(0) 编辑

双塔模型-向量内积-tf.keras.layers.Dot()使用

摘要：Dot层计算两个向量中的样本间的点乘，同时也是基于batch的点乘，使用起来非常方便，在模型输出前不用再独立书写cosine部分返回：shape为（batch_size, 1）,表明batch中每一组对应样本的点乘。注意：如果在双塔中使用，在Dot前要对塔两侧向量做l2范数归一化。示例代码： d 阅读全文

posted @ 2022-06-27 14:05 今夜无风阅读(900) 评论(0) 推荐(0) 编辑

Keras模型训练过程中loss为Nan情况分析与处理

摘要：情景：推荐召回模型训练，开始的几个epoch损失正常下降，在到某个epoch下loss突然为nan，但模型仍在继续training，最终在模型预测时，结果都为零。查阅相关资料，可能的原因如下： 1）训练集中可能出现为NAN的特征； 2）自定义loss函数中，会存在分母为零的异常，可以加入微小的长阅读全文

posted @ 2022-06-20 19:52 今夜无风阅读(1323) 评论(0) 推荐(0) 编辑

hive\mysql 中的join理解

摘要：记住一张图阅读全文

posted @ 2022-06-16 22:16 今夜无风阅读(14) 评论(0) 推荐(0) 编辑

SENet双塔模型：在推荐领域召回粗排的应用及其它

摘要：目前，双塔结构在推荐领域里已经是个常规方法了，在召回和粗排环节的模型选型中，被广泛采用。其实，不仅仅是在推荐领域，在其它领域，双塔结构也已经被越来越多得用起来了。比如，在当代搜索引擎的召回环节，除了常见的经典倒排索引来对Query和Document进行文本字面匹配外，经常也会增加一路基于Bert模型阅读全文

posted @ 2022-06-13 21:33 今夜无风阅读(1207) 评论(0) 推荐(0) 编辑

06 2022 档案

公告