摘要: Factorization machine,因子分解机,把所有特征进行高阶组合,减少人工参与特征组合的工作, 在 LR 的基础上考虑交叉项,某些特征经过关联之后,与 label 的相关性会提高,比如球类运动配件和男性这两个特征。所以 FM 解决的问题是1.特征稀疏 2.特征组合 一般线性模型无法学习 阅读全文
posted @ 2020-07-15 22:27 rjxuu 阅读(377) 评论(0) 推荐(0) 编辑
摘要: LR是线性模型,学习能力有限,此时特征工程尤其重要。现有的特征工程主要集中在寻找有区分度的特征、特征组合,但未必会有效果提升。 GBDT的算法特点可以用来发掘有区分度的特征、特征组合,减少特征工程中的人力成本。相当于将决策树的路径作为LR的输入特征,对于树的每条路径,都是通过最大增益分割出来的有区分 阅读全文
posted @ 2020-07-15 22:23 rjxuu 阅读(190) 评论(0) 推荐(0) 编辑