摘要: 简介 如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。 阅读全文
posted @ 2018-04-13 17:53 布尔先生 阅读(17186) 评论(0) 推荐(1) 编辑
摘要: XGBoost参数 在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters: General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster 阅读全文
posted @ 2018-04-13 17:52 布尔先生 阅读(297) 评论(0) 推荐(0) 编辑
摘要: xgboost是基于GBDT原理进行改进的算法,效率高,并且可以进行并行化运算,而且可以在训练的过程中给出各个特征的评分,从而表明每个特征对模型训练的重要性, 调用的源码就不准备详述,本文主要侧重的是计算的原理,函数get_fscore源码如下,源码来自安装包:xgboost/python-pack 阅读全文
posted @ 2018-04-13 17:51 布尔先生 阅读(4534) 评论(0) 推荐(0) 编辑
摘要: 一、数据集预处理 1、数据读入 2、数据划分 二、特征工程 1、提取其他特征 2、提取优惠券相关特征 3、提取商户相关特征 4、提取用户的相关特征 5、用户和商店之间联系的特征 三、特征组合 四、模型训练 对特征筛选,训练,方便除去对标签影响因子小的特征属性,即剪枝 五、总结 本次按着大佬的思路做了 阅读全文
posted @ 2018-04-13 17:43 布尔先生 阅读(910) 评论(0) 推荐(0) 编辑