04 2018 档案

摘要:简介 如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。 阅读全文
posted @ 2018-04-13 17:53 布尔先生 阅读(17244) 评论(0) 推荐(1) 编辑
摘要:XGBoost参数 在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters: General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的booster 阅读全文
posted @ 2018-04-13 17:52 布尔先生 阅读(300) 评论(0) 推荐(0) 编辑
摘要:xgboost是基于GBDT原理进行改进的算法,效率高,并且可以进行并行化运算,而且可以在训练的过程中给出各个特征的评分,从而表明每个特征对模型训练的重要性, 调用的源码就不准备详述,本文主要侧重的是计算的原理,函数get_fscore源码如下,源码来自安装包:xgboost/python-pack 阅读全文
posted @ 2018-04-13 17:51 布尔先生 阅读(4564) 评论(0) 推荐(0) 编辑
摘要:一、数据集预处理 1、数据读入 2、数据划分 二、特征工程 1、提取其他特征 2、提取优惠券相关特征 3、提取商户相关特征 4、提取用户的相关特征 5、用户和商店之间联系的特征 三、特征组合 四、模型训练 对特征筛选,训练,方便除去对标签影响因子小的特征属性,即剪枝 五、总结 本次按着大佬的思路做了 阅读全文
posted @ 2018-04-13 17:43 布尔先生 阅读(922) 评论(0) 推荐(0) 编辑
摘要:1.快捷键 Jupyter Notebook 有两种键盘输入模式。编辑模式,允许你往单元中键入代码或文本;这时的单元框线是绿色的。命令模式,键盘输入运行程序命令;这时的单元框线是灰色。 命令模式 (按键 Esc 开启) Enter : 转入编辑模式 Shift-Enter : 运行本单元,选中下个单 阅读全文
posted @ 2018-04-09 15:58 布尔先生 阅读(596) 评论(0) 推荐(0) 编辑
摘要:1. 背景 1.1 Gradient Boosting Gradient Boosting是一种Boosting的方法,它主要的思想是,每一次建立模型是在之前建立模型损失函数的梯度下降方向。损失函数是评价模型性能(一般为拟合程度+正则项),认为损失函数越小,性能越好。而让损失函数持续下降,就能使得模 阅读全文
posted @ 2018-04-09 14:32 布尔先生 阅读(672) 评论(0) 推荐(0) 编辑
摘要:1、背景 CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变 阅读全文
posted @ 2018-04-09 14:29 布尔先生 阅读(657) 评论(0) 推荐(0) 编辑
摘要:一:问题描述 题目中涉及到严格的时间概念,例如:预测未来N天的流量(人流,销售等),预测未来N天内的用户-对象对(用户-商品等)的问题等,都可以利用滑窗法解决。诸如类似形式的问题,尤其是要有严格的时间概念的问题。 二:基本方法 假设:题目描述为预测未来N天的流量信息,其中N的取值为大于等于1。基本诸 阅读全文
posted @ 2018-04-09 10:04 布尔先生 阅读(1893) 评论(0) 推荐(0) 编辑
摘要:1.LaTeX软件的安装和使用方法A(自助):在MikTeX的官网下载免费的MikTeX编译包并安装。下载WinEdt(收费)或TexMaker(免费)等编辑界面软件并安装。方法B(打包):在ctex.org下载ctex套装(含MikTeX及WinEdt)哈哈这一部分当然不包含在标题的30分钟里。2 阅读全文
posted @ 2018-04-03 17:26 布尔先生 阅读(337) 评论(0) 推荐(0) 编辑
摘要:什么是TensorFlow? TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。它灵活的架构让你可以在多种平台上展开计算,例 阅读全文
posted @ 2018-04-03 14:54 布尔先生 阅读(639) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示