推荐系统-如何理解特征交叉
目标是在数据稀疏的情况下,用模型来做特征交叉。(特征交叉可以发掘特征之间的关联性)
目标解读:我们假设一个场景:数据包含用户id,性别,年龄,地区特征来预测对口红的点击率。如果性别为女而且年轻,那么他对口红的点击率应该高,这说明性别和年龄有关联,需要在多项式后,加一项(系数a*x1*x2),这就是特征交叉,让模型把这个当成新的特征,理解为年轻女性,那么这项系数应该是比较大的。但是现实中的数据可能年轻女性比较少,只有当女性和年轻两个特征都为1的数据才能用来训练系数a,数据过少导致系数a的值不精确。这就是人工特征+LR的不足之处。FM来解决这个问题。
时刻记着自己要成为什么样的人!