1 只考虑二阶特征组合情况,穷举所有可能的二阶特征组合并用LR训练,与直接使用FM训练,哪一种效果更好?为什么?
答:使用FM效果更好。原因是穷举所有二阶特征组合,对于高维稀疏特征来说,某些特征组合项非0的样本数是很少的,势必会导致学出来的权重不准,这也是为什么FM要学习特征隐向量的原因。
2 如果把连续特征不做离散化处理,直接用到FM中来,你觉得会对模型有什么影响?
答:连续特征的样本分布是很稀疏的,也就是每个特征值很可能只对应几个样本,这样学出来的特征组合权重是不准的。
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步