推荐系统-如何理解特征交叉

目标是在数据稀疏的情况下,用模型来做特征交叉。(特征交叉可以发掘特征之间的关联性)

目标解读:我们假设一个场景:数据包含用户id,性别,年龄,地区特征来预测对口红的点击率。如果性别为女而且年轻,那么他对口红的点击率应该高,这说明性别和年龄有关联,需要在多项式后,加一项(系数a*x1*x2),这就是特征交叉,让模型把这个当成新的特征,理解为年轻女性,那么这项系数应该是比较大的。但是现实中的数据可能年轻女性比较少,只有当女性和年轻两个特征都为1的数据才能用来训练系数a,数据过少导致系数a的值不精确。这就是人工特征+LR的不足之处。FM来解决这个问题。

posted @   今夜无风  阅读(117)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示