1 只考虑二阶特征组合情况,穷举所有可能的二阶特征组合并用LR训练,与直接使用FM训练,哪一种效果更好?为什么?
答:使用FM效果更好。原因是穷举所有二阶特征组合,对于高维稀疏特征来说,某些特征组合项非0的样本数是很少的,势必会导致学出来的权重不准,这也是为什么FM要学习特征隐向量的原因。
2 如果把连续特征不做离散化处理,直接用到FM中来,你觉得会对模型有什么影响?
答:连续特征的样本分布是很稀疏的,也就是每个特征值很可能只对应几个样本,这样学出来的特征组合权重是不准的。