XGBoost缺失值引发的问题及其深度分析
摘要:
XGBoost模型作为机器学习中的一大“杀器”,被广泛应用于数据科学竞赛和工业领域,XGBoost官方也提供了可运行于各种平台和环境的对应代码,如适用于Spark分布式训练的XGBoost on Spark。然而,在XGBoost on Spark的官方实现中,却存在一个因XGBoost缺失值和Spark稀疏表示机制而带来的不稳定问题。 阅读全文
posted @ 2019-08-16 11:10 美团技术团队 阅读(2701) 评论(0) 推荐(1) 编辑