DCN V2 Improved Deep & Cross Network and Practical Lessons for Web-scale Learning to Rank Systems

目录

Wang R., Shivanna R., Cheng D. Z., Jain S., Lin D., Hong L. and Chi E. D. DCN V2: Improved deep & cross network and practical lessons for web-scale learning to rank systems, 2020.

DCN 的升级版.

DCN-v2

  • DCN-v2 的 cross/deep 的结合方式上有上述两种, 具体的好坏和数据有关系.

  • 相较于 DCN, DCN-v2 的主要改进在于 cross network 部分:

    xl+1=x0(Wlxl+bl)+xl.

    这里 WlRd×d, 之前的 DCN 是 WlR1×d.

  • 特别的, 作者发现, 这种方式学出来的 W 通常是低秩的, 所以对于 Wl 做了进一步的改进:

    Wl=UlVlT,Ul,VlRd×r,rd,rd.

  • 同时, 引入 MoE 机制:

    xl+1=i=1KGi(xl)Ei(xl)+xl,

    其中 Gi() 得到对第 i 个专家的权重 (通过 sigmoid, softmax 等实现), Ei 则定义如下:

    Ei(xl)=x0(Ulig(Clig(VliTxl))+bl).

    这是对在压缩到低维空间后通过非线性激活函数 g()Cli 仅进一步的转换.
posted @   馒头and花卷  阅读(72)  评论(2编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
历史上的今天:
2023-08-29 Time-aware Path Reasoning on Knowledge Graph for Recommendation
点击右上角即可分享
微信分享提示