【华为云技术分享】不为人知的稠密特征加入CTR预估模型的方法

【摘要】本文介绍了一种比较新颖的稠密特征加入CTR预估模型的方法并用图示的方法演示了基本稠密特征加入神经网络中过程。

稠密特征一般是相对稀疏特征来说的，我们知道类别特征经过独热编码之后比较稀疏，比如类别 [‘小猫’，‘小狗’，‘小熊’，‘小猴’] 被独热编码后的数据结构为[[1,0,0,0],[0,1,0,0],[0,0,1,0],[0,0,0,1]]，可以看到这种数据很稀疏，但是像桌子的长度这种稠密特征数据一般就是 [3.4,2.6,8.9,6.7] 这种。一般针对类别特征都是通过词嵌入的方法把稀疏特征转化为稠密特征然后再输入到神经网络中，不然直接输入会导致维度爆炸等问题，那么怎样把稠密数据加入到CTR预估网络模型中呢？

常规方法

1. 如图 1 所示，把原始的稠密特征直接和全连接层进行连接不和通过词嵌入转化的类别稠密特征进行交叉：

▲ 图1. 直接送入全连接

右边的类别特征经过词嵌入后每个类别特征都被映射成了一个向量，不同的类别向量之间经过交叉运算得到交叉特征。而左边的原始稠密特征不和类别特征进行交叉，直接和高阶的交叉特征进行拼接作为全连接层的输入。

2. 如图 2 所示，把原始稠密特征离散化，转换为离散特征，然后和原始类别特征都进行词嵌入，之后再进行特征交叉。此时可以发现，这样相当于原始稠密特征参加了特征交叉：

▲ 图2. 离散处理

3. 如图 3 所示，对每个原始稠密特征x维护一个词嵌入向量e，然后把原始稠密特征和权重向量相乘得到最终的特征向量，相当于一个稠密特征映射成一个特征向量，之后和类别映射的词嵌入矩阵进行拼接。此时仍然可以发现，这样相当于原始稠密特征也可以和类别特征进行交叉特征提取：

▲ 图3. 稠密特征与embedding vector相乘

鲜为人知的Key-Value Memory方法

在ICMEW的一篇论文中提出了一种把Key-Value Memory [1] 应用到稠密特征处理上的方法，如图4所示，可以看到这个模型的输入是一个稠密特征q，输出是一个特征向量v，也就是实现了1维到多维的特征空间转换，那么具体看一下是怎样实现的。

图4. Key-Value Memory模型结构 [1]

向量v的计算是通过对每个embedding vector vi 进行加权求和得到的，公式表示为：

其中wi的计算为：

Ki的计算等于

其中要对q进行归一化。我的理解就是把一个稠密特征的值q映射成一个权重分布，再用这个权重分布去和维护的N个embedding vector加权求和，最后得到一个和词嵌入维度相同的向量v。得到向量v之后就和前面的方法一样，可以和类别特征进行特征交叉了。

总结

从上面几种方法可以发现，稠密特征要和词嵌入后的类别特征做交叉需要在同一个维度空间，也就是要把一维的稠密特征转化成和词嵌入维度相同的特征空间中，同时上面方法中的词嵌入矩阵相当于权重矩阵都可以进行优化学习。后续文章会有稠密特征加入CTR模型各个方法的具体实现代码，喜欢就关注一下吧

参考文献

[1] Multi-modal Representation Learning for Short Video Understanding and Recommendation. ICME Workshops 2019: 687-690

作者：wanderist

posted @ 2020-02-29 16:31 华为云官方博客阅读(273) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

编辑推荐：
· SQL Server 2025 AI相关能力初探
· Linux系列：如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理

阅读排行：
· 阿里最新开源QwQ-32B，效果媲美deepseek-r1满血版，部署成本又又又降低了！
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决：字节Trae VS Cursor，谁才是开发者新宠？
· 开源Multi-agent AI智能体框架aevatar.ai，欢迎大家贡献代码
· Manus重磅发布：全球首款通用AI代理技术深度解析与实战指南

公告

昵称：华为云官方博客
园龄： 5年5个月
粉丝： 75
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

最新随笔

随笔分类 (14)

随笔档案 (920)

文章分类 (1)

数据库(1)

文章档案 (11)

2022年3月(11)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:教你如何将华为云CDN日志转存到OBS
天天发软文，能不能发你们客户的实践案例出来！@
--xiaohuazi
2. Re:Jmeter压测工具使用之HetuEngine压力测试
天天发软文，能不能发你们客户的实践案例出来！@
--xiaohuazi
3. Re:Too many open files的四种解决办法
还是官方的博客有含金量
--pythonic#
4. Re:大型情感剧集Selenium：6_selenium中的免密登陆与cookie操作【华为云技术分享】
太棒了，解决了我的问题。虽然我目标网站的key我试了很多次才试出来哈哈
--SmartMapple
5. Re:activate-power-mode，让你在Python编码中，感受炫酷的书写特效！
看到有人推荐这个插件,一看,原来是加打字特效用的,那么就不用看了,简直是影响专注,用几下就会头疼了
--haogaoxing
6. Re:【华为云技术分享】基于小熊派STM32芯片的通过MQTT上报JSON数据到华为物联网平台的自动售货机Demo解析
老哥，怎么没有看到工程文件得下载链接啊
--void520
7. Re:.Net Core下使用MQTT协议直连IoT平台
谢谢分享
--沈赟
8. Re:【IoT平台北向API调用】使用Postman调用Https接口
请问Postman设置里的CRT文件和KEY文件从哪里可以获取
--残花织梦
9. Re:鲲鹏性能优化十板斧——鲲鹏处理器NUMA简介与性能调优五步法
666
假装能看懂
--God Li
10. Re:鲲鹏性能优化十板斧——鲲鹏处理器NUMA简介与性能调优五步法
懵逼的来,懵逼的走
--Best_Hong
11. Re:.Net Core下使用MQTT协议直连IoT平台
我这里不行，报错
Connecting with MQTT server failed (ClientIdentifierNotValid).
--Work Log
12. Re:关于token你需要知道的【华为云技术分享】
怎么搞也搞不出来，官网教程一塔湖图，登入名和用户名的区别是个啥？
--海阔天空XM