01 2025 档案

摘要:def inbatch_softmax_loss(user_pred_vector, item_pred_vector, item_id, labels): labels = tf.linalg.diag(tf.reshape(tf.ones_like(labels),[-1])) diff = t 阅读全文
posted @ 2025-01-22 18:13 xd_xumaomao 阅读(13) 评论(0) 推荐(0) 编辑
摘要:论文链接:HoME: Hierarchy of Multi-Gate Experts for Multi-Task Learning at Kuaishou 背景 论文指出现在的MMOE/PLE模型存在以下几个问题: 1. 专家崩溃:专家的输出分布存在显着差异,并且一些专家使用 ReLU 的零激活率 阅读全文
posted @ 2025-01-22 12:03 xd_xumaomao 阅读(72) 评论(0) 推荐(0) 编辑
摘要:模型结构:左边多个encoder结构堆叠 + 右边多个decoder结构堆叠 + Linear + softmax计算预估概率 encoder输入:词embedding和position embedding求和,shape是(batch,suqence len, input_dim) encoder 阅读全文
posted @ 2025-01-21 10:46 xd_xumaomao 阅读(4) 评论(0) 推荐(0) 编辑
摘要:#include <iostream> #include <vector> class DynamicArray { private: std::vector<int> arr; public: // 默认构造函数 DynamicArray() {} // 析构函数 ~DynamicArray() 阅读全文
posted @ 2025-01-20 11:03 xd_xumaomao 阅读(4) 评论(0) 推荐(0) 编辑
摘要:广告行业中那些趣事系列24:从理论到实践解决文本分类中的样本不均衡问题 阅读全文
posted @ 2025-01-15 11:53 xd_xumaomao 阅读(6) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示